
REPUBLIQUE FRANQAISE 



KT/FR2004/ 003 0 1 7 



■^Hi INSTITUT 

NATIONAL DE 
LA PROPRIETE 
INDUSTRIELLE 


tsod 


0 7 FES 2GG5 




wipo 


PCT 



BREVET D 'INVENTION 



CERTIFICAT D'UTILITE - CERTIFICAT D'ADDITION 



COPIE OFFICIELLE 

Le Directeur general de I'lnstitut national de la propriete 
industrielle certifie que le document ci-annexe est la copie 
certifiee conforme d'une demande de titre de propriete 
industrielle deposee a I'lnstitut 



Fait a Paris, le . 



JJLlQOOfli. 



DOCUMENT DE PRIORITE 

PRESENTE OU TRANSMIS 
CONFORMEMENT A LA 
REGLE17.1.a)OUb) 



Pour le Directeur general de I'lnstitut 
national de la propriete Industrielle 
Le Chef du Departement des brevets 




SIEGE 

INSTITUT 26bl», ruedeSalnt-Peterabouig 

NATIONAL DE ™™> '""1?%* 08 " 

Ttiiphone : 33 (0)1 53 04 53 04 
IA PROPRIETE Tfflteopto:33(O)153 04 45 23 
INDUSTRIELLE www.lnpl.fr 



Marline PLANCHE 



i er depot 



■■HBBINSTITUT 

NATIONAL DC 
LA PflOPMETC 
tNOUSTRICLlC 

26 bis, rue de Saint Petersbourg 
75800 Paris Cedex 08 

Telephone : 33 (1) 53 04 53 04 T&ecopie : 33 (1) 42 94 86 54 



I Reserve* a IWI I 



REMISE DES PIECES 
DATE 

lieu 27 NOV 2003 
n° d'enreg^^eIMP^ PARIS 34 SP 

NATIONAL ATTRIBUE PAR L'INPI 

DATEDE DEPOT ATTRIBUTE 
PAR LMNPI 



0313907 
2 7 MOV. 2003 



Vos references pour ce dossier 

(facuttattp 



H277980/1.JBT 



BREVET D1NVENTION 
CERTIFICAT D'UTILITE 

Code de la proprtete intellectuelle - Uvre VI 

REQUETE EN DELIVRANCE 

page 1/2 

Get imprime est a remplir lisiblement a I'encre noire 



N° 11354*03 



08 540W/2105O2 



I NOW! ET ADRESSE DU DEMANDEUR OU DU MANDATAIRE 
A QUI LA CORRESPONDANCE DOIT ETRE ADRESSEE 

■ 

CABINET BEAU DE LOMENIE 
158, rue de" l'Unrversite 
75340 PARIS CEDEX 07 
FRANCE 



Confirmation d'un depot par teiecopie 


□ N° attribue par I'lNPI a la teiecopie 








l^ci i \a\ lUc Uc Ufcvcl 




Demande de certificat d 9 utilite 


□ ~ 


Demande divisionnaire 

Demande de brevet initiate 
ou demande de ce/ tificatd 'a tints' initiate 


□ j 

N° n a t fi 1 . 1 . 1 , , i | 
N° - Date 1 . 1 i 1 i f | | 


Transformation d'une demande de 
brevet europeen Demattde de brevet initiate 


D i 

N° Date 1 • 1 i 1 i i i 1 1 


|3 TITRE DE (.'INVENTION (200 caracteres on 
"Procede d 1 indexation 


esDaces maximum) 1 

et d T identification de documents multimedias" J 


O DECLARATION DE PRIORITE 
OU REQUETE DU BENEFICE DE 
LA DATE DE DEPOT D'UNE 
DEMANDE ANTERIEURE FRANpAISE 


Pays ou organisation J 
Date 1 : 1 i t i i | no 1 

Pays ou organisation 1 
Date I » I i I j j 1 1 N° f 

Pays ou organisation 1 
Date 1 I 1 ; 1 i i ! 1 w° 1 

□ S'il y a d'autres priorites, cochez la case et utillsez rimprimd «Suite» I 


msum 


I {Cochez rune &ek ?, &3ses) : 




Nom 

ou denomination sociale 


ADVESTIGO ~| 


Prenoms 




Forme juridique 


Societe Anonyme ~| 


N° SIREN 


Li— L-l l l I i i I " | 


Code APE-NAF 




1 1 i « 1 - - 


Domicile 
ou 

siege 


Rue- 


1, avenue de la Terrasse I 
Bat. 5 1 


Code postal et ville 


I9ilili9i8| GIF-SUR-YVETTE CEDEX j 


Pays 


FRANCE 1 


Nationality 


Francaise "" "" 1 


N° de telephone (facuitattj) 


N° de teiecopie tfacutteti/) ~~ " 1 


Adresse electronique (faadtatif) 






□ S'il y a plus d'un demandeur. cochez la case et utilisez Fh^priinS «Suite>7 1 




BtltSTtTtfT 
NAtlONAL DE 
LA PSOPR1ETE 
tNDUSTRIELtC 



1er depot 

BREVET D'INVENTION 

CERTIFICAT D'UTILITE 

REQUETE EN DELIVRANCE 

page 2/2 




fR<Sserv6 k I'INPI \ 



REMISE DES PIECES 
DATE 

27 NOV 2003 



UEU 



N° D'ENREGll . ^ 
NATIONAL ATTRIBUE PAR LMNPI 03 "I 3907 



Cabinet ou Soci6t6 



N °de pouvoir permanent et/ou 
de lien contractue! 



Adresse 



Rue 



Code postal etvilie 



Pays 



N° d e telephone (facuflatiQ 
N° de telecopie (/hcuttaiif) 
Adresse electronique (facuilatif) 



Les demandeurs et les inventeurs 
sont les memes personnes 



H277980/1.JBT 



DB540W/2105O2 




CABINET BEAU DE IsGMENIE 



158, rue de l'Universite 



17,5,3,4! 0| PARIS CEDEX 07 



FR A NCE 

01.44. 18-89. 00 



~0lT45Vl8.04.23~ 




13 Non : Dans ce cas remplir le forroulaire de Designation d'inventeurfc) 



Etablissement immediat 
ou etablissement differe 



Paiement echelonne de la redevance 

(en deux tenements) 



0 
□ 



Uniquemerrt pour les personnes physiques effectuant elles-memes leur propre depot 

□ Oui 

□ Non 



REDUCTION DU TAUX 
DES REDEVANCES 



Uniquement pour les personnes physiques 

□ Requise pour la premiere fois pour cette invention (Joind/v tm avis de non imposition) 

□ Obtenue anterieurement a ce depot pour cette invention (Joindre une copie de /a 
decision d'admission 4 i'assistetwegmtuite ou wdiquersa r£fere??cej: AG f , i i i 1 



gj SEQUENCES DE NUCLEOTIDES 
ET/OU D'ACIDES AMINES 



□ Cochez la case si la description contient une liste de sequences 



Le support electronique de donnSes est joint 

La declaration de conformity de la liste de 
sequences sur support papier avec le 
support electronique de donnSes est jointe 



□ 
□ 



Si vous avez utilise I'imprime «Suite», 
indiquez le nombre de pages jointes 



f~[j SIGNATURE DU DESVJANDEUR 
OU DU SV3ANDATAIRE 
(Nom et qualite du signataire) 



Jean-Bruno THEVENET 
CPI W° 92-1236 



VISA DE LA PREFECTURE 
OU DE LMNPI 



AT 



La loi n°78-17 du 6 Janvier 1978 relative a P inform atique, aux fichiers et aux libertes s'applique aux reponses faites a ce formulaire. 
Eile garantit un droit d'accfcs et de rectification pour les donnees vous concernant aupr&s de I'INPI. 



1 er depot 



1 



Procede d'indexation et d'identification de documents multimedias 



La presente invention se rapporte aux precedes d'indexation et 
d'identification de documents multimedias. 

Du point de vue general, Identification d'un document multimedia 
comporte deux phases : 

■ Une phase dite d'indexation, ou I'on cherche a caracteriser chaque 
document d'une base prealablement enregistree par un nombre fini de 
parametres pouvant facilement etre stockes et manipules ulterieurement. 

Une phase dite de recherche, ou suite a une requite formulee par 
I'utilisateur, par exempie I'identification d'une image question, I'on cherche 
tous les documents multimedias similaires ou repondant a cette requete. 

II existe deja de nombreux procedes d'indexation dimages qui 
mettent en oeuvre I'extraction des attributs de la forme des objets 
composants llmage slls existent, ainsi que ceux de la texture ou de la 
couleur de fond de Hmage 

Toutefois, les procedes connus s'appliquent dans des domaines tres 
specialises ou impliquent le traitement d'un tres grand nombre 
d'informations qui conduisent a une complexity et une lenteur dans le 
traitement de ces informations. 

La presente invention vise a remedier aux inconvenients precites et 
a fournir un precede" d'indexation et d'identification de documents 
multimedias d'une application generate qui rationalise le processus de 
traitement et conduit a des temps de traitement plus courts tout en 
augmentant la qualite des resultats et leur fiabilite, ce qui permet 
notamment de proceder a des recherches efficaces par le contenu. 

Ces buts sont atteints conformement a I'invention, grace a un 
procede d'indexation de documents multimedias, caracterise en ce qu'il 
comprend les etapes suivantes : 

(a) identification et extraction pour chaque document de termes ti 
constitues par des vecteurs caracterisant des proprietes du document 
multimedia a indexer, telles que la forme, la texture, la couleur ou la 
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structure d'une image, I'energie, le taux d'oscillation ou des 
informations frequentielles d'un signal audio, ou un groupe de 
caracteres d'un texte , 

(b) stockage des termes tj caracterisant des proprietes du document 
5 multimedia dans une base de termes comprenant P termes, 

(c) determination d'un nombre maximum N de concepts souhaites 
regroupant les termes t| les plus pertinents, N etant un nombre 
entier inferieur a P, et chaque concept q etant prevu pour regrouper 
tous les termes voisins du point de vue de leurs caracteristiques, 

10 (d) calcul de la matrice T de distances entre les termes fc. de la base de 
termes, 

(e) decomposition de I'ensemble P des termes tj de la base de termes en 
N parties Pj (1 £ j^N) telles que P = PI UP 2 - UP 3 ... UP N , chaque 
partie Pj comprenant un ensemble de termes et etant representee 

15 par un concept Cj, les termes tj etant repartis de telle facon que les 

termes les plus eloignes se trouvent dans des parties Pi, P m distinctes 
et les termes proches se trouvent dans la m§me partie P if 
(0 structuratlon du dictionnaire de concepts de maniere a consbtuer un 
arbre binaire ou les feuilles conbennent les concepts c f du 

20 dictionnaire et les nceuds de Parbres conbennent les informations 

necessaires a la scrutation de I'arbre lors d'une phase d'identification 
d'un document par comparaison avec les documents precedemment 
indexes, et 

(g) construction d'une base d'empreintes constituee de I'ensemble des 
25 concepts q representant les termes tj des documents a indexer, 

chaque document etant associe a une empreinte qui lui est propre. 

De facon plus particuliere, on associe a chaque concept q de la 
base d'empreintes un ensemble d'informations comprenant le nombre NbT 
30 de termes dans les documents IndiceDoc ou le concept q est present. 

Selon un aspect particulier et I'invention, pour chaque document 
IndiceDoc ou un concept q est present, on enregistre une empreinte du 
concept q dans le document IndiceDoc, cette empreinte comprenant la 
frequence d'occurrence du concept q, I'ldentification des concepts qui sont 
35 voisins du concept q dans le document IndiceDoc et un score qui est une 
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structure d'une image, I'energie, le taux d'oscillation ou des 
informations frequentielles d'un signal audio, ou un groupe de. 
caracteres d'un texte , 

(b) stockage des termes t} caracterisant des proprietes du document 
5 multimedia dans une base de termes comprenant P termes, 

(c) determination d'un nombre maximum N de concepts souhaites 
regroupant les termes tj les plus pertinents, N etant un nombre 
entier inferieur a P, et chaque concept q etant prevu pour regrouper 
tous les termes voisins du point de vue de leurs caracteristiques, 

10 (d) calcul de la matrice T de distances entre les termes ti de la base de 
termes, 

(e) decomposition de I'ensemble P des termes ti de la base de termes en 

N parties Pj (1 <: j<N) telles que P = PI UP 2 ™ UP, ... UP N , chaque * 
partie P 3 comprenant un ensemble de termes t y et etant representee 
15 par un concept q, les termes tj etant repartis de telle facon que les ^ 

termes les plus eloignes se trouvent dans des parties Pi, P m distinctes Z- 
et les termes proches se trouvent dans la meme partie Pi, : Z 

(f) structuration du dictionnaire de concepts de maniere a constituer un »; 
arbre binaire ou les feuilles contiennent les concepts q du 2 

20 dictionnaire et les nceuds de I'arbres contiennent les informations > 

necessaires a. la scrutation de I'arbre lors d'une phase d'identification 
d'un document par comparaison avec les documents precedemment 
indexes, et 

(g) construction d'une base d'empreintes constitute de I'ensemble des 
25 concepts q representant les termes ti des documents a indexer, 

chaque document etant associe a une empreinte qui lui est propre. 

De facon plus particuliere, on associe a chaque concept q de la 
base d'empreintes un ensemble d'informations comprenant le nombre NbT 
30 de termes dans les documents ou le concept q est present. 

Selon un aspect particulier et I'invention, pour chaque document ou 
un concept q est present, on enregistre une empreinte du concept q dans 
le document, cette empreinte comprenant la frequence d'occurrence du 
concept q, I'identification des concepts qui sont voisins du concept q dans 
35 le document et un score qui est une valeur moyenne des mesures de 
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valeur moyenne des mesures de similarites entre le concept q et !es 
termes t* du document IndiceDoc qui sont les plus proches du concept q. 

Avantageusement, le procede selon I'invention comprend une etape 
d'optimisation de la partition de Pensemble P des termes de la base de 
5 termes pour decomposer cet ensemble P en M classes Q (1 < i < M, avec 
M < P), de maniere a require I'erreur de la repartition de I'ensemble P des 
termes de la base de termes en N parties (Pi, P2,... Pn) ou chaque partie Pj 
est representee par le terme tj qui sera pris comme concept q, I'erreur 

N 

commise e etant telle que e = ^e t ou e h = '£d 2 (t lt t J ) est I'erreur 

10 commise lorsqu'on remplace les termes tj d'une partie Pi par t|. 

Dans ce cas, le procede peut comprendre les etapes suivantes : 

(i) on decompose I'ensemble P de termes en deux parties Pi et P2 ; 

(ii) on determine les deux termes les plus eloignes t} et tj de I'ensemble 
P correspondant a la plus grande distance Dg de la matrice T de 

15 distances ; 

(iii) pour chaque terme t* de I'ensemble P, on examine si la distance D w 
entre le terme t^et le terme tj est plus petite que la distance Dkj entre 
le terme et le terme tj, si c'est le cas on affecte le terme t* a la 
partie Pi et si ce n'est pas le cas on affecte le terme t* a la partie P 2 ; 

20 (iv) on itere I'etape (i) jusqu'a I'obtention du nombre N de points P, 
souhaite et a chaque iteration on applique les Stapes (ii) et (iii) sur 
les termes des parties Pi et P2. 
Le procede selon I'invention peut §tre plus particulierement 
caracterise en ce qu'il comprend une optimisation a .partir des N parties 
25 disjointes Pi,... Pnt de I'ensemble P ainsi que des IM termes \t Xl t 2/ tN ^ 
qui les representent pour reduire I'erreur de decomposition de I'ensemble 
P en N parties, et en ce qu'il comprend les etapes suivantes : 

(i) calcul des centres de gravite Q des parties Pj 
30 (ii) calcul des erreurs eQ = ^d 2 (C t> tj) et etj = ]r<* 2 (/,,/,) lorsqu'on 

tfePi ^ 

remplace les termes tj de la partie Pi respectivement par Q et par tj, 



(iii) comparaison de etj et eq et remplacement de tj par Q si sq < eti, 
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similarities entre le concept q et les termes % du document qui sont les 
plus proches du concept q. 

Avantageusement, le procede selon I'invention comprend une etape 
d'optimisation de la partition de I'ensemble P des termes de la base de 
5 termes pour decomposer cet ensemble P en M classes Q (1 <, i <, M, avec 
M <, P), de maniere a reduire I'erreur de la repartition de I'ensemble P des 
termes de la base de termes en N parties (Pi, P 2r ... Pn) oil chaque partie Pi 
est representee par le terme ti qui sera pris comme concept q, I'erreur 
commise e etant telle que e = ou e h = 2> 2 (*,.,f y ) est I'erreur 

10 commise lorsqu'on remplace les termes tj d'une partie Pi par tj. 

Dans ce cas, le proceed peut comprendre les etapes suivantes : 

(i) on decompose I'ensemble P de termes en deux parties Pi et P 2 ; 

(ii) on determine les deux termes les plus eloignes ti et tj de I'ensemble 1 
P correspondant a la plus grande distance D|j de la matrice T de 7 

15 distances ; i7j 

(Hi) pour chaque terme tk de I'ensemble P, on examine si la distance D w J 
entre le terme t k et le terme ti est plus petite que la distance Dfcj entre t- 
le terme. t k et le terme t j7 si e'est le cas on affecte le terme t k a la 
partie Pi et si ce n'est pas le cas on affecte le terme t k a la partie P 2 ; ; f 
20 (iv) on itere I'etape (i) jusqu'a I'obtention du nombre N de points P ( 
souhaite et a chaque iteration on applique les etapes (ii) et (iii) sur 
les termes des parties Pi et P 2 . 
Le procede selon I'invention peut etre plus particulierement 
caracterise en ce qu'il comprend une optimisation a partir des N parties 
25 disjointes <! P lt P 2/ ... P N f- de I'ensemble P ainsi que des N termes i ti, t 2/ t N } 
qui les represented pour reduire I'erreur de decomposition de I'ensemble 
P en N parties, et en ce qu'il comprend les etapes suivantes : 

(i) calcul des centres de gravite Q des parties Pi 
30 (ii) calcul des erreurs sC, = 2> 2 (CV,) et eti = £ d 2 (t t ,t.) lorsqu'on 

remplace les termes t,- de la partie Pi respectivement par Q et par tj, 

(iii) comparaison de eti et eq et remplacement de ti par Q si eq <, eti, 
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(iv) calcul de la nouvelle matrice T de distances entre les termes ti de la 
base de termes et processus de decomposition de I'ensemble P des 
termes de la base de termes en N parties, sauf si une condition 

d'arret est remplie avec eC( ~ e ° M < seuil, ou ec t represente I'erreur 

ec t 

5 commise a I'instant t. 

Afin de faciliter la recherche et ('identification de documents, pour 
effectuer une structuration du dictionnaire de concepts, on produit de 
facon iterative a chaque iteration une carte de navigation en commengant 
10 par scinder I'ensemble des concepts en deux sous-ensembles, puis en 
selectionnant un sous-ensemble a chaque iteration jusqu'a I'obtention du 
nombre de groupes souhaite ou jusqu'a ce qu'un critere d'arret soit 
satisfait 

Le critere d'arret peut etre caracterise par le fait que les sous- 
15 ensembles obtenus sont tous homogenes avec un ecart-type faible. 

De facon plus particuliere, lors de la structuration du dictionnaire de 
concepts, on determine des indicateurs de navigation a partir d'une 
matrice M = [ci, c 2/ ... cn] e St**** 1 de i'ensemble C des concepts q e 9l p ou 
Q represente un concept de p valeurs, selon les etapes suivantes : 
20 (i) on calcule un representant wde la matrice M , 

(ii) on calcule la matrice de covariance M entre les elements de la 

matrice M et le representant ivde la matrice M, 

(iii) on calcule un axe de projection u des elements de la matrice M, 

(iv) on calcule la valeur pi = d(u, Ci) - d(u, w) et on decompose 
25 I'ensemble de concepts C en deux sous-ensembles CI et C2 de la 

maniere suivante : 

c t e CI si pi < 0 
c s e C2 si pi > 0 



30 

(v) on stocke dans le nceud associe a C les informations {u, w, |pl|, p2} 
ou pi est le maximum de tous les pi ^ 0 et p2 est le minimum de 
tous les pi > 0, I'ensemble des informations {u, w, |pl|, p2} 
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constituant les indicateurs de navigation dans le dictionnaire de 
concept. 

Selon un mode particulier de realisation, on analyse a la fois les 
composantes structurelles et le complement de ces composantes 
structurelles constitue par les composantes texturales d'une image du 
document, et : 

(a) lors de Panalyse des composantes structurelles de I'image 

(al) on procede a une repartition des zones frontieres des structures de 
I'image en differentes classes selon rorientation de la variation locale 
d'intensite de maniere a definir des elements de support structure! 
(ESS) de I'image, et 

(a2) on procede par analyse statistique a la construction de termes 
constitues par des vecteurs decrivant les proprietes locales et- 
globales des elements de support structured, ; 

(b) lors de I'analyse des composantes texturales de I'image ** 
(bl) on procede a une detection et une caracterisation parametrique ' 

d'une composante purement aleatoire de I'image, 
(bl) on procede a une detection et une caracterisation parametrique 

d'une composante periodique de I'image, 
(b3) on procede a une detection et une caracterisation parametrique 

d'une composante dlrectionnelle de I'image, 

(c) on regroupe dans un nombre limite de concepts I'ensemble des 
elements descriptifs de I'image constitues par d'une part les termes 
decrivant les proprietes locales et globales des elements de support 
structured et d'autre part les parametres des caracterisations 
parametriques des composantes aleatoire, periodique et 
directionnelle definissant les composantes texturales de I'image, et 

(d) on definit pour chaque document une empreinte a partir des 
occurrences, des positions et des frequences desdits concepts. 

Avantageusement, les proprietes locales des elements de support 
structured prises en compte pour la construction de termes comprennent 
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au moins le type de support choisi parmi une bande lineaire ou un arc de 
courbe, les dimensions en longueur et largeur du support, la direction 
principale du support et la forme et les proprietes statistiques des pixels 
constituant le support. 
5 Les proprietes globales des elements de support structurels prises 

en compte pour la construction de termes comprennent au moins le 
nombre de chaque type de supports et leur disposition spatiale. 

De preference, lors de I'analyse des composantes structurelles de 
I'image on procede a un test prealable de detection de la presence d'au 
10 moins une structure dans I'image et, en cas d'absence de structure, on 
passe directement a Petape de I'analyse des composantes texturales de 
I'image. 

Avantageusement, pour proc^der a une repartition des zones 
frontieres des structures de I'image en differentes classes, a partir de 

15 I'image numerisee definie par I'ensemble des pixels y(i,j) ou (i,j) e I x J, 
avec I et J designant respectivement le nombre de lignes et le nombre de 
colonnes de I'image, on calcule I'image gradient vertical g v avec (i,j) e 
I x J et I'image gradient horizontal gh avec (i,j) e I x J et on procede au 
partitionnement de I'image selon Porientation locale de son gradient en un 

20 nombre fini de classes equidistantes, I'image contenant Porientation du 
gradient etant definie par la formule 

O = arc tan [|^] , (D 

25 on identifie les classes constituant des regions de support susceptibles de 
contenir des elements de support significatifs, et a partir des regions de 
support, on determine les elements de support significatifs et on les 
repertorie selon des criteres predetermines. 

Selon un aspect particulier de Pinvention, on analyse les formes 

30 d'une image d'un document selon les etapes suivantes : 

(a) on procede a une multiresolution suivie d'une decimation de I'image, 

(b) on definit I'image dans Pespace logarithmique polaire. 

(c) on represente I'image ou la portion de I'image concernee par sa 
transformee de Fourier H, 
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(d) on procede a une caracterisation de la transformer de Fourier H de la 
facon sulvante : 

(dl) on projette H dans plusleurs directions pour obtenir un ensemble 
de vecteurs dont la dimension est egale a la dimension du 
5 mouvement de projection, 

(d2) on calcule les proprietes statistiques de chaque vecteur de 
projection, et 

(e) on represente la forme de I'image par un terme tj constitue des 
valeurs des proprietes statistiques de chaque vecteur de projection. 

10 Selon un aspect particulier de I'invention, lors de I'indexation d'un 

document multimedia comportant des signaux video, on choisit des 
termes ti constitues par des images-cles representant des groupes 
d'images homogenes consecutives, et on determine des concepts q par 
regroupement de termes tj. 
15 Pour determiner des images-cles constituant des termes ti , on 

elabore d'abord un vecteur score VS comprenant un ensemble d'elem'ents 
VS(i) materialisant la difference ou la similarity entre le contenu d'une 
image d'indice i et celui d'une image d'indice i-1, et on analyse le vecteur 
score VS afin de determiner les images-cles qui correspondent aux 
20 maximums des valeurs des elements VS(i) du vecteur score VS. 

De facon plus particuliere, une image d'indice j est consideree 
comme une image-cle si la valeur VS(j) de I'element correspondant du 
vecteur score VS est un maximum et que la valeur VSQ") est situee entre 
deux minimums min G et min D et que ie minimum Ml tel que 
25 Ml = ( I VS 0 -) - min G I , I VS 0) - min D I ) est superieur a un seuil donne. 

On considerera a nouveau I'indexation d'un document multimedia, 
comportant des composantes audio, on echantillonne et decompose le 
document en trames, qui sont ensuite regroupees en clips dont chacun est 
caracterise par un terme tj constitue par un vecteur de parametre. 
30 Une trame peut comprendre par exemple entre environ 512 et 2048 

echantillons du document audio echantillonne. 

Avantageusement, les parametres pris en compte pour la definition 
des termes t- comprennent des informations temporelles correspondant a 
au moins I'un des parametres suivants : I'energie des trames du signal 
35 audio, I'ecart-type des energies des trames dans les clips, le rapport des 
variations sonores, le rapport de basse energie, le taux d'oscillation autour 
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d'une valeur predetermines, le haut taux d'oscillation autour d'une valeur 
predeterminee,, la difference entre le nombre de taux d'oscillation au- 
dessus et au-dessous du taux d'oscillation moyen des trames de clips, la 
variance du taux d'oscillation, le rapport des trames silencieuses. 
5 Toutefois, de facon alternative ou complementaires, de facon 

avantageuse, les parametres pris en compte pour la definition des termes 
tj comprennent des informations frequentielles correspondant a au moins 
Tun des parametres suivants : le centre de gravite du spectre de 
frequence de la transformee de Fourier courte du signal audio, la largeur 

10 de bande du signal audio, le rapport entre Penergie dans une bande de 
frequence et Penergie totale dans toute la bande de frequence du signal 
audio echantillonne, la valeur moyenne de la variation du spectre de deux 
trames adjacentes dans un clip, la frequence de coupure d'un clip. 

De fagon plus particuliere, les parametres pris en compte pour la 

15 definition des termes tj peuvent comprendre au moins la modulation 
d'energie a 4 Hz. 

D'autres caracteristiques et avantages de Pinvention ressortiront de 
la description suivantes de modes particuliers de realisation, donnes a titre 
d'exemples, en reference aux dessins annexes, sur lesquels : 

20 - la Figure 1 est un schema-bloc montrant le processus de 

production d'un dictfonnaire de concepts a partir d'une base de 
documents, conformement a Pinvention, 

-la Figure 2 montre le principe de construction d'une base de 
concepts a partir de termes, 

25 - la Figure 3 est un schema-bloc montrant le processus de 

structuration d'un dictionnaire de concepts, conformement a Pinvention, 

- la Figure 4 montre la structuration d'une base d'empreintes mise 
en ceuvre dans le cadre du precede selon Pinvention, 

- la Figure 5 est un organigramme montrant les differentes etapes 
30 de construction d'une base d'empreintes, 

- la Figure 6 est un organigramme montrant les differentes etapes 
d'identification de documents, 

- la Figure 7 est un organigramme montrant la selection d'une 
premiere liste de reponses, 
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- la Figure 8 est un organigramme montrant les differentes etapes 
d'une phase d'indexation de documents conformement au proced<§ selon 
I'invention, 

- la Figure 9 est un organigramme montrant les differentes etapes 
d'extraction de termes dans le cas du traitement d'images, 

-la Figure 10 est un schema resumant le processus de 
decomposition d'une image reguliere et homogene, 

- les Figures 11 a 13 montrent trois exemples d'images contenant 
differents types d'elements, 

-les Figures 14a a 14f montrent respectivement un exemple 
d'image originate, un exemple d'image apres traitement en prenant en 
compte le module du gradient, et quatre exemples d'images traitees avec 
demantelement des zones frontieres de I'image, 

- la Figure 15a represente un premier exemple d'image contenant 
un element directionnel, 

- la Figure 15al est une vue 3D du spectre de I'image de la Figure 

15a, 

- la Rgure 15b represente un deuxieme exemple d'image contenant 
un element directionnel, 

- la Figure 15bl est une image module de Fourier de I'image de la 
Figure 15b, 

- la Rgure 15c represente un troisieme exemple d'image contenant 
deux elements directionnels, 

- la Rgure 15cl est une image module de Fourier de I'image de la 
Rgure 15c, 

- la Rgure 16 illustre des directions de projection pour des couples 
d'entiers (a, J3) dans le cadre du calcul de la transformee de Fourier 
Discrete d'une image, 

- la Figure 17 illustre un exemple de mecanisme de projection avec 
I'exemple d'un couple d'entrees (ok, 0 k ) = (2, -1), 

-la Figure 18al represente un exemple d'image contenant des 
composantes periodiques, 

- la Rgure 18a2 represente I'image module de la transformee de 
Fourier Discrete de I'image de la Rgure 18al, 

-la Figure 18bl represente un exemple d'image synthetique 
contenant une composante periodique, 
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- la Figure 18b2 represente une vue en 3D de la transformee de 
Fourier Discrete de I'image de la Figure 18bl, faisant apparaftre une paire 
de pics symetriques, 

- la Figure 19 est un organigramme montrant les differentes etapes 
5 de traitement d'une image avec etablissement d'un vecteur caracterisant 

la distribution spatiale des proprieties iconiques de I'image, 

- la Figure 20 montre un exemple de partitionnement d'une image 
et de creation d'un vecteur caracteristique de cette image, 

- la Figure 21 montre une rotation de 90° de I'image partitionnee 
10 de la Figure 20 et la creation d'un vecteur caracteristique de cette image, 

-la Figure 22 montre la decomposition d'un signal sonore en 
trames en clips, 

-la Figure 23a montre la variation de I'energie d'un signal de 
parole, 

15 -la Figure 23b montre la variation de I'energie d'un signal de 

musique, 

- la Figure 24a montre le taux de passage par zero d'un signal de 
parole, 

- la Figure 24b montre le taux de passage par zero cTun signal de 
20 musique, 

- la Figure 25a montre le centre de gravite du spectre de frequence 
de la transformee de Fourier courte d'un signal de parole, 

- la Figure 25b montre le centre de gravity du spectre de frequence 
de la transformee de Fourier courte d'un signal de musique, 

25 - la Figure 26a montre la largeur de bande d'un signal de parole, 

- la Figure 26b montre la largeur de bande d'un signal de musique, 

- la Figure 27a montre pour trois sous-bandes de frequence 1, 2, 3 
le rapport d'energie dans chaque sous-bande de frequence sur I'energie 
totale de toute la bande de frequence, pour un signal de parole, 

30 - la Figure 27b montre pour trois sous-bandes de frequence 1, 2, 3 

le rapport d'energie dans chaque sous-bande de frequence sur I'energie 
totale de toute la bande de frequence, pour un signal de musique, 

- la Figure 28a montre le flux spectral d'un signal de parole, 

- la Figure 28b montre le flux spectral d'un signal de musique, 

35 -la Figure 29 est un graphique illustrant la definition de la 

frequence de coupure d'un clip, et 
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-la Figure 30 illustre, pour un signal audio, la modulation de 
I'energie autour de 4 Hz. 

On decrira d'abord en reference aux Figures 1 a 5 le prlncipe 
general du procede d'indexation de documents multimedias selon 
I'invention, qui conduit a la construction d'une base d'empreintes, chaque 
document indexe etant assocle a une empreinte qui lui est propre. 

A partir d'une base de documents multimedias 1, une premiere 
etape 2 consiste en Identification et I'extraction, pour chaque document, 
de termes tj constitues par des vecteurs caracterisant des proprietes du 
document a indexer. 

A titre d'exemples, on decrira, en reference aux Figures 22 a 30, la 
facon dont il est possible d'identifier et d'extraire des termes ti pour'un 
document sonore. 

Un document audio 140 est d'abord decompose en trames 160 qui 
sont regroupees par la suite en clips 150 dont chacun va etre caracterise 
par un terme constitue par un vecteur de parametres (Figure 22). Un 
document audio 140 sera done caracterise par un ensemble de termes tj 
qui seront stockes dans une base de termes 3 (Figure 1). 

Les documents audio dont on a extrait leur vecteur caracteristique 
peuvent etre echantillonnes par exemple a 22 050 Hz afin d'eviter I'effet 
de crenelage. Le document est ensuite divise en un ensemble de trames 
dont le nombre d'echantillons par trame est fixe en fonction du type de 
fichier a analyser. 

Pour un document audio riche en frequences et qui contient 
beaucoup de variations, comme les films par exemple, les emissions de 
varietes ou encore les emissions sportives, le nombre d'echantillons dans 
une trame doit etre faible, de I'ordre de 512 echantillons par exemple. En 
revanche, pour un document audio homogene ne contenant que de la 
parole ou de la musique par exemple, ce nombre doit etre important, par 
exemple de I'ordre de 2 048 echantillons. 

Un clip de document audio peut etre caracterise par differents 
parametres servant a constituer les termes et caracterisant des 
informations temporelles ou frequentielles. 

II est possible d'utiliser tout ou partie des parametres qui seront 
mentionnes ci-dessous pour former des vecteure de parametres 
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constituant les termes identifiant les clips successifs du document audio 
echantillonne. 

L'energie des trames du signal audio constitue un premier 
parametre representant une information temporelle. 

5 L'energie du signal audio varie beaucoup pour la parole alors qu'elle 

est plutot stable pour la musique. Elle permet done de discriminer la 
parole de la musique mais aussi de detecter les silences. L'energie peut 
etre couplee a un autre parametre temporel tel que le taux d'oscillation 
(TO) autour d'une valeur, qui peut correspondre par exemple au taux de 

10 passage par zero (TPZ). En effet un TO faible et une energie forte sont 
synonymes d'un son voise tandis qu'un TO eleve indutt une zone non 
voisee. 

La Figure 25a represente un signal 141 qui illustre la variation de 
l'energie dans le cas d'un signal de parole. 
15 La Figure 23b represente un signal 142 qui illustre la variation de 

l'energie dans le cas d'un signal de musique. 

Soit N le nombre d'echantillons dans une trame, le volume ou 
energie E(n) est defini par : 




20 ou S n (i) represente la valeur de I'echantillon i de la trame d'indice n d'un 
signal audio. 

D'autres parametres representatifs d'informations temporelles 
peuvent etre deduits de l'energie, comme par exemple : 
25 - I'ecart type des energies des trames dans les dips (encore appele 

EEC ou VSTD) qui constitue un etat defini comme la variance des volumes 
des trames dans un clip normalise par le maximum du volume des trames 
du clip, 

- le rapport des variations sonores (RVS) qui est constitue par la 
30 difference entre le maximum et le minimum des volumes des trames d'un 

clip divise par le maximum des volumes de ces trames, 

- le rapport de basse energie (ou LER) qui est le pourcentage des 
trames dont le volume est inferieur a un seuil (qui est fixe par exemple a 
95% du volume moyen d'un clip). 
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D'autres parametres permettent de caracteriser I'aspect temporel 
d'un clip, en particulier le taux d'oscillation autour d'une valeur 
predeterminee, qui, lorsque cette valeur predeterminee est zero, definit un 
taux de passage par zero (ou TPZ). 

Le TPZ peut aussi Stre defini par le nombre de fois ou I'onde passe 
par zero . 

^(»)=7(XI^(^0'X-(^g«(^0-l))|)4 ( 3 ) 

^ 1=0 N 

Sn (i) :Valeur de I'echantillon i, de la trame n. 
N : nombre d'echantillons dans une trame. 
fs : frequence d'echantillonnage. 

Cette caracteristique est frequemment utilisee pour fa classification parole 
/ musique. En effet, les brusques variations du TPZ sont significatives de 
I'alternance voisee / non voisee done de la presence de parole. Pour la 
parole, le TPZ est faibie pour les zones voisees et tres elev£ pour les zones 
non voisees alors que pour la musique, les variations du TPZ sont tres 
faibles. 

La Figure 24a montre une courbe 143 illustrant un exemple de TPZ 
pour un signal de parole. 

La Figure 24b montre une courbe 144 illustrant un exemple de TPZ 
pour un signal de musique. 

Un autre parametre caracterisant I'aspect temporel d'un clip peut 
§tre constitue par le haut taux d'oscillation autour d'une valeur 
predeterminee qui, lorsque cette valeur predeterminee est zero, definit un 
haut taux de passage par zero (ou HTPZ). 

Le HTPZ peut etre defini comme etant le rapport du nombre de 
trames dont le TPZ est a une valeur a, par exemple 1,5 au-dessus du TPZ 
moyen du clip (Is) : 

HTPZ = -LfJ [sgn(ZPZ(») - 1 .SavTPZ) + 1] (4) 
telque: avTPZ=— ! £TPZ(n) . (5) 
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avec: 

n : indice de la trame . 

N : nombre de trames dans un clip. 

Pour !es segments de parole les clips sont de 0 a 200 s avec un HTPZ 
5 autour de 0,15. 

En revanche, pour les segments de musique, les clips sont de 200 a 350 s 
et le HTPZ varle autour de 0,05 et est en general quasi nul. 

Pour le son d'environnement les segments correspondant aux clips sont de 
351 a 450 s, 

10 Le HTPZ est faible pour le bruit blanc et grand pour un son 

assourdissant (tambour par exemple). 

On peut encore definir le parametre DTPZ qui est constitue par la 
difference entre le nombre de TPZ au-dessus et en-dessous du TPZ moyen 
des trames d'un clip, ainsi que le parametre VTPZ qui est constitue par la 
15 variance du TPZ. 

Un autre parametre caracterisant 1'aspect temporel d'un clip est le 
rapport des trames silencieuses (RFS) qui est le pourcentage des trames 
non silencieuses dans un clip. 

Une trame est non silencieuse si son volume depasse un certain 
20 seuil (10) et si la valeur du TPZ est inferieure a un Tpz seuil. 

Alnsi le rapport de trames non silencieuses dans un clip, permet de 
detecter le silence. 

D'autres proprietes statistiques du TPZ peuvent etre utilisees 
comme parametres caracteristiques, telles que : 
25 i) moment du troisieme ordre de la moyenne, 

il) le nombre de TPZ depassant un certain seuil. 

Les parametres pris en compte pour la definition des termes tj 
peuvent comprendre egalement des informations frequentielles qui 
30 prennent en compte le calcul de la transformee de Fourier rapide (FFT) du 
signal audio. 

Ainsi, un parametre appele centroi'de spectacle (CS) peut etre defini 
comme etant le centre de gravite du spectre de frequence de la 
transformee de Fourier courte (STFT) du signal audio : 
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N-i 



2X(o 

( 6) 

IX (0 



1=0 



telle que s a (i) : Puissance spectrale de la trame I du clip n . 

Le parametre CS est eleve pour la musique car les hauteurs sont 
reparties sur une zone plus etendue que celle de la parole (en general 6 
octaves pour la musique et 3 pour la parole ). II a une relation avec la 
sensation de la brillance du son qu'on entend. C'est un attribut perceptuel 
important pour la caracterisation du timbre . 

La Figure 25a montre une courbe 145 illustrant un exemple de CS 
pour un signal de parole. 

La Figure 25b montre une courbe 146 illustrant un exemple de CS 
pour un signal de musique. 

Un autre parametre est constitue par la largeur de bande LB qui 
peut etre calculee a partir de la variance du parametre precedent CS(n). 



Z(i-CS(n)) 2 s„(f) 

LB 2 (ri)=— (y) 



f=0 



La largeur de bande LB est importante tant en musique qu'en 

parole. 

La Figure 26a montre une courbe 147 illustrant un exemple de 
largeur de bande d'un signal de parole. 

La Figure 26b montre une courbe 148 illustrant un exemple de 
largeur de bande d'un signal de musique. 

Un autre parametre utile est constitue par le rapport ERSB entre 
I'energie dans une sous-bande de frequence i et I'energie totale dans 
toute la bande de frequence du signal audio echantillonne. 

En considerant les proprietes perceptuelles de I'oreille humaine, la 
bande de frequence a ete divisee en quatre sous-bandes ou ces dernieres 
correspondent aux filtres de Cochlear. Quand la frequence d'echan- 
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tillonnage est de 22025 Hz, les bandes de frequences sont : 0-630Hz , 
630-1720HZ, 1720-4400Hz et 4400-1 1025Hz .Pour chacune de ces 
bandes on calcule son energie ERSBi, qui correspond au rapport de 
I'energie de cette derniere sur I'energie dans toute la bande de frequence . 

5 La Figure 27a montre trois courbes 151, 152, 153 illustrant pour 

trois sous-bandes de frequence 1, 2, 3 le rapport d'energie dans chaque 
sous-bande de frequence sur I'energie totale de toute la bande de 
frequence, pour un exemple de signal de parole. 

La Figure 27b montre trois courbes 154, 155, 156 illustrant pour 

10 trois sous-bandes de frequence 1, 2, 3 le rapport d'energie dans chaque 
sous-bande de frequence sur I'energie totale de toute la bande de 
frequence, pour un exemple de signal de musique. 

Un autre parametre est constitue par le flux spectral qui est d£fini 
comme la valeur moyenne de la variation du spectre de deux trames 

15 adjacentes dans un clip : 

FS(n)^f i [log(S a (i)+S)-lo S (S„{i-l)+S)f (8) 

ou 

8 : Une constante de faible valeur, 

S„(i) : Puissance spectrale de la trame i du clip n. 

20 Le flux spectral de la parole est en general plus important que celui 

de la musique, et celui du son d'environnement est le plus grand. II varie 
considerablement en comparaison avec les deux autres signaux. 

La Figure 28a montre une courbe 157 illustrant le flux spectral d'un 
exemple de signal de parole. 
25 La Figure 28b montre une courbe 158 illustrant le flux spectral d'un 

exemple de signal de musique. 

Un autre parametre utile est constitue par la frequence de coupure 
d'un clip (FCC). 

La Figure 29 montre une courbe 149 illustrant le spectre 
30 d'amplitude en fonction de la frequence fe, et la frequence de coupure fc 
qui est la frequence en dessous de laquelle 95% de I'energie du spectre 
(la puissance spectrale) est concentree. 
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Pour determiner la frequence de coupure du clip, on calcule la 
transformee de Fourier du clip DS(n) 



DSOO = J (0 (9) . La frequence fc est determined par : 
5 X S '(i)^0.95xDS (10)et X S n(0<0.95xDS) (11) 

La FCC est plus elevee pour un son non voise (son riche en hautes 
frequences ) que pour un son voise (presence de parole ou la puissance 
est concentree dans les basses frequences). 

Cette mesure permet de caracteriser les alternances voisees/non 
0 voisees de la parole car cette valeur est faible pour les clips contenant 
uniquement de la musique. 

D'autres parametres peuvent encore etre pris en compte pour la 
definition des termes tj d'un document audio, comme la modulation 
d'energie autour de 4 Hz, qui constitue un parametre issu a la fois d'une 
> analyse frequentielle et d'une analyse temporelle. 

La modulation d'energie a 4 Hz (4 ME) est calculee a partir du 
contour du volume, selon la formule suivante : 



It IT T 



4ME= ^ (12) 



/=0 



oil S n (i) : Puissance spectrale de la trame i du clip n . 

WQ) : Fenetre triangulaire centree a 4Hz. 
T : Largeur d'un clip. 

La parole a une 4ME plus importante que la musique car, pour la 
parole, les changements de syllabe se situent autour de 4Hz. 
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Une syllabe est en effet une combinaison d'une zone de faible 
energie (consonne) et d'une zone de forte energie (voyelle). 

La Rgure 30 montre une courbe 161 illustrant un exemple de signal 
audio et une courbe 162 montrant pour ce signal la modulation de 
5 I'energie autour de 4 Hz. 

On a decrit ci-avant le cas de documents multimedias comportant 
des composantes audio. 

Dans le cas de ^indexation de documents multimedias comportant 
des signaux video, on peut choisir des termes tj constitues par des 
10 images-cles representant des groupes d'images homogenes consecutives. 

Les termes tj peuvent a leur tour representer par exemple les 
couleurs dominantes, les proprietes texturales, les structures de zones 
dominantes des images-cles du document video. 

D'une maniere generate, dans le cas des images qui sera developpe 
15 plus en detail plus loin, les termes peuvent representer les couleurs 
dominantes, les proprietes texturales, les structures des zones dominantes 
de I'image. Plusieurs procedes peuvent §tre mis en oeuvre de fagon 
alternative ou cumulative, aussi bien sur la totalite de I'image que sur des 
portions de I'image, pour determiner les termes tj devant caracteriser 
20 I'image. 

Dans le cas d'un document contenant du texte, les termes ti 
peuvent etre constitues par des mots du langage parte ou ecrit, par des 
nombres et par d'autres identificateurs constitues de combinaisons de 
caracteres (par exemple des combinaisons de lettres et de chiffres). 

25 On considerera a nouveau I'indexation d'un document 

multimedia comportant des signaux video, pour lequel on choisit des 
termes tj constitues par des images-cles representant des groupes 
d'images homogenes consecutives, et on determine des concepts q par 
regroupement des termes tj. 

30 La detection des images cles repose sur le regroupement des 

images d'un document video en groupes contenant chacun uniquement 
des images homogenes. De chacun des groupes on extrait une ou 
plusieurs images (appelees images cles) representant le document video. 

Le regroupement des images du document video repose sur la 

35 production d'un vecteur score appele VS representant le contenu de la 
video, il caracterise la variation des images consecutives de la video 
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(I'element VS ( materialise la difference entre le contenu de I'image d'indice 
i et celui de I'image d'indice i-l), VS est egal a zero quand les contenus irrij 
et imi-i sont identiques et il est important quand la difference entre les 
deux contenus est importante. 
5 Pour calculer le signal VS, les trois bandes de chaque image imj 

RGB d'indice i de video sont additionnees pour ne constituer qu'une seule 
image qu'appelee TRi. Ensuite, I'image TRi est decomposed en plusieurs 
bandes de frequence pour ne conserver que la composante basse 
frequence TRBi. On utilise pour cela deux filtres a miroir (un filtre Passe 
10 bas PB et un filtre Passe Haut PH) qui sont appliques successivement sur 
les lignes et sur les colonnes de I'image. On considerera deux types de 
filtre : I'ondelette de Haar et le filtre dont I'algorithme est le suivant : 

Balayage ligne 1 

15 A partir de TRk on produit i'image Bas T 

Pour chaque point a2xu de i'image TR faire ~' 

Calculer le point by de I'image basse frequence bas, Dm prend la valeur Z 

mediane de a^j-i, a2xij et a^cy+i- * 

20 Balayage Colonne 

A partir des deux images Bas on produit I'image TRBk 
Pour chaque point b i/2 xj de I'image TR faire 

Calculer le point bby de I'image basse frequence bas, bby prend la valeur 
mediane de bj,2xj-i,bj,2xj et b^+i 
25 Les balayages ligne et colonne sont appliques autant de fois 

qu'on le souhaite. Le nombre d'iterations depend de la resolution des 
images de la video. Pour des images de taille 512x512 ou peut fixer n a 
trois. 

L'image resultatTRBi est projetee dans plusieurs directions pour 
30 obtenir un ensemble de vecteurs Vk, k est I'angle de projection 
(I'element j de VO, vecteur obtenu suite a la projection horizontale de 
I'image, est egal a la somme de tous les points de la ligne j de I'image). 
Les vecteurs de directions de I'image TRBi sont compares aux vecteurs de 
direction de TRBi-1 pour obtenir un score i qui mesure la similarite entre 
35 ces deux images. Ce score est obtenu par la moyenne de toutes les 
distances des vecteurs de m§me direction : pour chaque k on calcule la 
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distance entre le vecteur Vk de I'image i et le vecteur Vk de I'image i-1 
puis on calcule toutes ces distances. 

L'ensemble de tous les scores constitue le vecteur score VS : 
I'element i de VS mesure la similarity entre I'image TRBi et I'image TRBi-1. 
Le vecteur VS est lisse afin d'eliminer les irregularites du au bruit 
engendre lors la manipulation de la video. 

On decrira ci-apres un exemple de regroupement des images et 

d'extraction des images cles. 

Le vecteur VS est analyse afin de determiner les images cl<§s qui 
correspondent aux maximums des valeurs de VS. Une image d'indice j est 
consideree comme une image-cl<§ si la valeur VS(j) est un maximum et si 
VSG) est situ6 entre deux minimums minG (minimum gauche) et minD 
(minimum droite) et si le minimum Ml tel que 

Ml = min ( I VS(Cj)-minG I , I VS(j)-min D I ) est superieur a un seuil donne. 

Pour detecter les images-cles, on initialise minG avec VS(0) puis 
on parcourt le vecteur VS de la gauche vers la droite. A chaque etape, on 
determine I'indice j correspondent a la valeur maximale situee entre deux 
minimums (minG et minD) puis en fonction du resultat de I'equation 
definissant Ml on decide de considerer j comme un indice d'une image-cle 
ou non. II est possible de prendre un groupe de plusieurs images-cles 
voisines, par exemple des images-cles d'indices j-1, j et j+1. 

Trois cas se presentent si le minimum des deux pentes, definies 
par les deux minimums (minG et minD) et la valeur maximale, n'est pas 

superieur au seuil : 

i) Si IVS(j) - minGI est inferieur au seuil et que minG ne 
correspond pas a VS(o), le maximum VS(j) est ignore et minD devient 
minG, 

ii) Si IVS(j) - minGI est superieur au seuil et si | VS(j)-minD | est 
inferieure au seuil, le minD et le maximum VS(j) sont conserves et minD 
est ignore sauf si le plus proche maximum a droite de min D est superieur 
a un seuil. Dans ce cas, on conserve aussi minD et on declare j comme un 
indice d'une image-cle. Dans le cas ou minD est ignore, minD prendra la 
valeur la plus proche du minimum situe a droite de minD. 

Hi) Si les deux pentes sont inferieures au seuil, minG est 
conserve et minD et j sont ignores. 
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Apres selection d'une image-cle, on itere le processus. A chaque 
iteration minD devient minG. 

Si Ton se reporte a nouveau a la Figure 1; a partir d'une base de ' 
termes 3 comprenant P termes, on procede dans une etape 4 a un 

5 traitement des termes t, et a leur regroupement en concepts q (Figure 2) 
destines a etre stockes dans un dictionnaire de concepts 5. II s'agit id 
d'elaborer un ensemble de signatures caracterisant une classe de 
documents. Les signatures sont des descripteurs qui, par exemple dans le 
cas de I'image, represented la couleur, la forme et la texture. Un 

10 document peut alors etre caracterise et represents par les concepts du 
dictionnaire. 

Une empreinte d'un document peut alors etre formee par les 
vecteurs signatures de chaque concept du dictionnaire 5. Le vecteur 
signature est constitue par les documents ou le concept q est present 

15 ainsi que par les positions et le poids de ce concept dans le document. 

Les termes tj extraits d'une base de documents 1 sont stockes dans - 
une base de termes 3 et traites dans un module 4 d'extraction de * 
concepts q qui sont eux-memes regroupes dans un dictionnaire de 
concepts 5. La Figure 2 illustre le processus de construction d'une base de 

20 concepts q (l£ i < m) a partir de termes tj (1< j < n) presentant des - T 
scores de similarity wij. 

Le module de la production du dictionnaire de concepts recoit en 
entree Pensemble P des termes de la base 3 et le nombre maximum N de 
concepts souhaite est fixe par Putilisateur. Chaque concept q est prevu 

25 pour regrouper tous les termes voisins du point de vue de leurs 
caracteristiques. 

Pour produire le dictionnaire de concepts, on commence par 
calculer la matrice de distance Tentre les termes de la base 3, cette 
matrice est utilisee pour creer une partition dont le cardinal est egal au 

30 nombre N de concepts souhaite. 

La creation du dictionnaire de concepts s'effectue en deux phases : 
Decomposition de Pen /Vparties P= Pi U Pi ... U fU 
Processus d'optimisation de la partition qui decompose >°en M classes 
P- Cx U Ci ... U O/avec West inferieur ou egal a P. 

35 Le processus d'optimisation a pour but de reduire I'erreur de la 

repartition de P en N parties {P Xr Pi, P N } ou chaque partie Pi est 
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representee par le terme t t qui sera pris comme concept, I'erreur commise 
est alors egale a I'expression suivante : 

s = JX ' e n ~ X^ 2 fc»0/ est ,/erre ur commise lorsqu'on 

remplace les termes tj de Pi par t/. 

On peut decomposer P en N parties de maniere a repartir les 
termes de telle facon que les termes les plus eloignes se trouvent dans 
des parties distinctes et les termes proches se trouvent dans la m§me 
partie. 

On decrira d'abord I'etape 1 de decomposition de I'ensembie de 
termes P en deux parties Pi et P 2 : 

(a) On determine les deux termes les plus eloignes tj et tj de P 
correspondent a la plus grande distance D ti de la matrice T. 

(b) Pour chaque t k de P, t k est affecte a Pi si la distance D w est plus petite 
que la distance Dig et a P 2 sinon. 

On itere I'etape 1 jusqu'a I'obtention du.nombre de parties souhaite 
et a chaque iteration on applique les etapes (a) et (b) sur les termes de 
I'ensembie PI et de I'ensembie P2. 

On decrira maintenant une phase d'optimisation. 

Le processus d'optimisation a pour point de depart les N parties 
disjointes de P {Pi, P 2 , P N } ainsi que les N termes <ti, t 2 , t*,} qui 
les representent et il est utilise afin de reduire I'erreur de decomposition 
de P en {Pi, P 2 , P N } parHes. 

On commence par calculer les centres de gravites Ci des Pi. Ensuite 
on calcule I'erreur ec t = *£d 2 (t„tj) qu'on compare a ec, et on remplace ti 

par Ci si sc t est inferieur a et t . Puis, apres avoir calcule la nouvelle matrice 

T et si la convergence n'est pas atteinte , on procede a une 

decomposition. La condition d'arret est definie par fegLZfgai) < seui i qu j 

ec, 

est de I'ordre de 10" 3 - ec, etant I'erreur commise a I'instant t qui 
represente llteration. 

On presente ci-dessous une matrice T de distances entre les 
termes, ou Dg designe la distance entre le terme tj et le terme tj. 
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La Figure 3 illustre, dans le cas de documents multimedias de 
contenus divers, un exemple de structuration du dictionnaire de concept 

Afin de faciliter la navigation a I'interieur du dictionnaire 5 et de 
determiner rapidement lors d'une phase d'identification le concept le plus 
proche d'un terme donne, le dictionnaire 5 est analyse et une carte de 
navigation 9 a I'interieur du dictionnaire est etablie. 

La production de la carte de navigation 9 s'effectue de facon 
iterative. A chaque iteration, on commence par scinder Pensemble de 
concepts en deux sous-ensembles, puis a chaque iteration on selectionne 
un sous-ensemble jusqu'a I'obtention du nombre de groupes souhaite ou 
bien jusqu'a ce que le critere d'arret soit satisfait. Ce critere d'arr§t peut 
etre par exemple que les sous-ensembles obtenus sont tous homogenes 
avec un ecart-type feible par exemple. Le resultat final est un arbre 
binaire ou les feuilles contiennent les concepts du dictionnaire et les 
nceuds de I'arbre contiennent les informations necessaires a la scrutation 
de I'arbre lors de la phase d'identification d'un document 

On decrira ci-dessous un exemple de module 6 de repartition d'un 
ensemble de concepts. 

L'ensemble de concepts C est represents sous la forme d'une 
matnce Jf-fe.^fcar", avec <, e »', ou c t repute un 
concept de p valeurs. Differentes methodes sont possibles pour assurer 
une repartition axiale. Dans ce cas, on commence par calculer le centre de 
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gravite C ainsi que I'axe utilise pour decomposer I'ensemble en deux sous- 
ensembles. 

Les etapes de traitement sont les suivantes : 

Etape 1 : on calcule un representant de fa matrice M tel que le centroTde 

1 w 

iv de la matrice M : w = — £ c, (13) 

Etape 2 : on calcule la matrice de covariance Mentre les elements de la 
matrice M et le representant de la matrice M avec, dans le cas particulier 
ci-dessus M = M - we , ou e = [y,l,...,l] (14) 

Etape 3 : on calcule un axe de projection des elements de la matrice M, 
par exemple le vecteur propre U associe a la plus grande valeur propre de 
la matrice de covariance. 

Etape 4: on calcule la valeur pi = u T {c ( -w) et on decompose I'ensemble 
de concepts C en deux sous-ensembles CI et C2 de la maniere suivante : 

fc £ e CI si pi < 0 

\c,sC2 sipi>0 ( 1S ) 



Les informations stockees dans le nceud associe a C sont {u, w, \pl\, p2> 
avec pi est le maximum de tous les pi < 0 et p2 est le minimum de tous 
les pi>0. 

L'ensemble {u, w, |pl|, p2> constitue les indicateurs de navigation dans 
le dictionnaire de concept. En effet pour determiner, tors de la phase 
dldentification par exemple, le concept le plus proche d'un terme ti, on 
calcule la valeur pti = u T (t t - w) puis on selectionne le nceud associe a CI 

si |/?tf|-|pl|<(p^-^2| et on selectionne le nceud C2 si non. On itere le 

processus jusqu'a ce que I'on ait atteint une des feuilles de I'arbre. 

Un module detecteur de singularite 8 peut etre associe au module 6 
de repartition des concepts. 
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Ce detecteur de singularite permet de selectionner I'ensemble CI a 
decomposer. Une des methodes possibles consiste a selectlonner 
I'ensemble le moins compact. 

Les Figures 4 et 5 illustrent Indexation d'un document ou d'une 
base de documents et la construction d'une base d'empreintes 10. 

La base d'empreintes 10 est constitute de I'ensemble des concepts 
representant les termes des documents a proteger. A chaque concept Ci 
de la base d'empreintes 10 est associee une empreinte 11, 12 13 
constitute par un ensemble d'informations telles que le nombre de termes 
dans les documents ou le concept est present, et pour chacun de ces 
documents on enregistre une empreinte lla, lib, lie comprenant 
I'adresse IndiceDoc du document, le nombre de termes, le nombre 
d'occurrences du concept (frequence), le score, ainsi que les concepts qui 
lui sont voisins dans le document. Le score est une valeur moyenne des 
mesures de similarity entre le concept et les termes du document qui sont 
les plus proches du concept. L'adresse IndiceDoc d'un document donne 
est stockee dans une base 14 des adresses des documents proteges. 

Le processus 20 de generation des empreintes ou signatures de 
documents a indexer est illustre sur la Figure 5. 

Lors de I'enregistrement d'un document IndiceDoc, on extrait les 
termes pertinents du document (etape 21) et on prend en compte le 
d.ctionnaire des concepts (etape 22). Chacun des termes t> du document 
IndiceDoc est projete dans i'espace du dictionnaire de concepts afin de 
determiner le concept q representant le terme t* (etape 23). 

On met ensuite a jour I'empreinte du concept q (etape 24) Cette 
mise a jour s'effectue selon que le concept a deja ete rencontre, e'est-a- 
dire est present dans les documents qui sont deja enregistres ou non. 

Si le concept q n'est pas encore present dans la base, on cree une 
nouvelle entree dans la base (une entree dans la base correspond a un 
objet dont les elements sont des objets contenant la signature du concept 
dans les documents ou ce concept est present). On initialise I'entree creee 
avec la signature du concept. La signature d'un concept dans un 
document IndiceDoc est materialised principalement par les informations 
su.vantes : IndiceDoc, NbTermes, Frequence, Concepts Voisins et score 
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Ce detecteur de singularity permet de selectionner I'ensemble Ci a 
decomposer. Une des methodes possibles consiste a selectionner 
I'ensemble le moins compact. 

Les Figures 4 et 5 illustrent I'indexation d'un document ou d'une 

5 base de documents et la construction d'une base d'empreintes 10. 

La base d'empreintes 10 est constituee de I'ensemble des concepts 
representant les termes des documents a proteger. A chaque concept Ci 
de la base d'empreintes 10 est associee une empreinte 11, 12, 13 
constituee par un ensemble d'informations telles que le nombre de termes 

10 dans les documents ou le concept est present, et pour chaoun de ces 
documents on enregistre une empreinte 11a, lib, 11c comprenant 
I'adresse du document, le nombre de termes, le nombre d'occurrences du 
concept (frequence), le score, ainsi que les concepts qui lui sont voisins 
dans le document. Le score est une valeur moyenne des mesures de 

15 similarite entre le concept et les termes du document qui sont les plus 
proches du concept. L'adresse d'un document donne est stockee dans une 
base 14 des adresses des documents proteges. 

Le processus 20 de generation des empreintes ou signatures de 
documents a indexer est illustre sur la Figure 5. 

20 Lors de Penregistrement d'un document, on extrait les termes 

pertinents du document (etape 21) et on prend en compte le dictionnaire 
des concepts (etape 22). Chacun des termes tj du document est projete 
dans I'espace du dictionnaire de concepts afin de determiner le concept q 
representant le terme ti (etape 23). 

25 On met ensuite a jour Pempreinte du concept q (etape 24). Cette 

mise a jour s'effectue selon que le concept a deja ete rencontre, c'est-a- 
dire est present dans les documents qui sont deja enregistres ou non. 

Si le concept q n'est pas encore present dans la base, on cree une 
nouvelle entree dans la base (une entree dans la base correspond a un 

30 objet dont les elements sont des objets contenant la signature du concept 
dans les documents ou ce concept est present). On initialise I'entree creee 
avec la signature du concept. La signature d'un concept dans un 
document est materialisee principalement par les informations suivantes : 
NbTermes, Frequence, Concepts Voisins et score. 
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Si le concept q existe dans la base, on ajoute a I'entree associee au 
concept sa signature dans le document IndiceDoc qui est composee de 
(IndiceDoc, NbTermes, Frequence, Concepts Voisins et score). 

Lorsque la base d'empreintes est construite (etape 25), on procede 
5 a I'enregistrement de la base d'empreintes (etape 26). 

La Figure 6 illustre un processus d'identification d'un document qui 
est implements sur une plate-forme 30 de recherche en ligne. 

^identification d'un document a pour objectif de determiner si un 
document pose comme question est la reutilisation d'un document de la 
10 base. Elle est basee sur la mesure de similarity entre documents. Le but 
est d'identifier les documents contenant des elements proteges. La reprise 
peut etre totale ou partielle. Dans ce dernier cas, Tenement copie a subi 
des modifications telles que : suppression de phrases dans un texte, 
suppression de motif dans une image, suppression de plan ou de 
15 sequence dans un document video,... changement d'ordre des termes pu 
substitution de tennes par d'autres termes dans un texte. 

Apres presentation d'un document a identifier (etape 31), on', 
procede a I'extraction des termes de ce document (etape 32). . 

En liaison avec une base d'empreintes (Stape 25), on met en~ 
20 correspondence les concepts calcules a partir des termes extraits de la 
question, avec les concepts de base (etape 33), afin d'etablir une liste de 
documents ayant des contenus similaires aux contenus du document 
question. 

Le processus d'etablissement de la Hste est le suivant : 
25 On note p<tj : le degre de ressemblance du document dj au 

document question, avec 1 <j^N , N est le nombre de documents de la 

base de reference 

On initialise a zero tous les Pdj 

Pour chaque terme ti de la question fourni a I'etape 331 (Figure 7) 
30 on determine le concept a qui le represente (etape 332). 

Pour chaque document dj ou le concept est present on met a jour 
son p^ de la maniere suivante : 

pdj =pdj +f(frequence, score), plusieurs fonctions f peuvent £tre utilisees 
par exemple flfrequen.ee, score) = frequence x score, frequence designe le 
35 nombre d'occurrences du concept Ci dans le document dj et score designe 
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Si le concept q existe dans la base, on ajoute a I'entree associee au 
concept sa signature dans le document qui est composee de (Adresse du 
document, NbTermes, Frequence, Concepts Voisins et score). 

Lorsque la base d'empreintes est construite (etape 25), on procede 
5 a I'enregistrement de la base d'empreintes (etape 26). 

La Figure 6 illustre un processus d'identification d'un document qui 
est implements sur une plate-forme 30 de recherche en ligne. 

^identification d'un document a pour objectif de determiner si un 
document pose comme question est la reutilisation d'un document de la 
10 base. Elle est basee sur la mesure de similarity entre documents. Le but 
est d'identifier les documents contenant des elements proteges. La reprise 
peut etre totale ou partielle. Dans ce dernier cas, I'element copie a subi 
des modifications telles que : suppression de phrases dans un texte, 
suppression de motif dans une image, suppression de plan ou de 
15 sequence dans un document video,... changement d'ordre des termes ou 
substitution de termes par d'autres termes dans un texte. 

Apres presentation d'un document a identifier (etape 31), on 
procede a i'extraction des termes de ce document (etape 32). 

En liaison avec une base d'empreintes (etape 25), on met en 
20 correspondance les concepts calcules a partir des termes extraits de la 
question, avec les concepts de base (etape 33), afin d'etablir une liste de 
documents ayant des contenus similaires aux contenus du document 
question. 

Le processus d'etablissement de la liste est le suivant : 
25 On note p dJ -: le degre de ressemblance du document dj au 

document question, avec l< j<N , N est le nombre de documents de la 

base de reference 

On initialise a zero tous les Pdj 

Pour chaque terme ti de la question fourni a I'etape 331 (Figure 7) 
30 on determine le concept Ci qui le represente (etape 332). 

Pour chaque document dj ou le concept est present on met a jour 
son pdj de la maniere suivante : 

pdj =pdj +f(frequence, score), plusieurs fonctions f peuvent etre utilisees 
par exemple f(frequence, score) = frequence x score, frequence designe le 
35 nombre d'occurrences du concept Ci dans le document dj et score designe 
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la moyenne des scores de ressemblance des termes du document dj avec 
le concept Cj. 

On ordonne les p dj et on conserve ceux qui sont superieurs a un 
seuil donne (etape 333). On precede ensuite a une confirmation et une 
validation des reponses (etape 34). 

Confirmation des reponses : la liste des reponses est filtree afln de 
n'en garder que les reponses les plus pertinentes. Le filtrage utilise est 
base sur la correlation entre les termes de la question et de chacune des 
reponses. " 

Validation: elle permet de ne conserver que les reponses ou il y a 
une grande certitude de reprise de contenu. Dans cette etape les reponses 
sont filtrees en tenant compte des propriety algebriques et topologiques 
des concepts a Hnterieur d'un document : on exige que le voisinage dans 
le document question soit respecte dans les documents reponses e'est a 
dire que deux concepts voisins dans le document question doivent etre 
voisins dans le document reponse. 

On fournitalors la liste des documents reponses (etape 35). 
On considered maintenant plus particulierement le cas de 
documents multimedias contenant des images. 
20 On decrira en particuiier pour la construction de la base 

d'empreintes qui servfra d'outil pour I'idenOfication d'un document des 
process rapides et efficaces d'identification damages qui tiennent compte 
de toutes les informations pertinentes contenues dans les images allant de 
la caracterisation des structures ou objets qui la composent, a celle des 
zones texturees et a la couleur de fond. Les objets de I'image sont 
identifies par la production d'une table resumant differentes statistiques 
faites sur des informations des zones frontieres des objets ainsi que des 
informations sur les voisinages de ces zones frontieres. La caracterisation 
des zones texturees peut etre effectuee a I'aide d'une description tres fine 
a la fois spatiale et spectrale de la texture suivant trois caracteristiques 
fondamentales qui sont sa periodicite, son orientation globale et I'aspect 
aleatoire de son motif. La texture est ici assimilee a une realisation de 
processus aleatoire bidimensionnel. La caracterisation de la couleur est un 
volet important de la methode. Elle peut etre utilisee comme un premier 
tn des reponses similaires basees sur la couleur, ou alors une derniere 
decision faite pour affiner la recherche. 
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Dans le premier volet de la phase de construction d'empreintes, on 
prend en compte des informations classifies sous forme de composants 
appartenant a deux grandes categories : 

- les composants dits structurels qui decrivent la perception par 
5 Pceil d'un objet pouvant §tre isole ou d'un ensemble d'objets dispose selon 

un arrangement spatial (images 81 et 82 des Figures 11 et 12), 

-les composants dits texturaux qui sont le complement des 
composants structurels et qui traduisent la regularity ou I'homogeneite des 
motifs de texture (images 82 et 83 des Figures 12 et 13). 
10 La Figure 11 montre ainsi une image 81 contenant des elements 

structurels et ne presentant pas de motifs de texture. 

La Figure 12 montre une image 81 contenant des elements 
structurels et un fond texture. 

La Figure 13 montre une image 83 sans elements structurels mais 
15 entierementtexturee. 

Comme indique plus haut, lors de la phase de construction 
d'empreintes, chaque document de la base de documents est analyse afin 
d'en extraire les informations pertinentes. Ces informations seront ensuite 
repertoriees et analysees. Cette analyse se fait suivant un enchamement 
20 de procedures qui se resume en trois etapes : 

- Extraction pour chaque document de caracteristiques predefinies 
et stockage de ces informations dans un vecteur appele terme. 

- Regroupement dans un concept de tous les termes "voisins" du 
point de vue de leurs caracteristiques, ce qui permet de rendre la 

25 recherche plus concise. 

- Construction d'une empreinte qui caracterise ce document par un 
nombre reduit d'entites. Chaque document est ainsi associe* a une 
empreinte qui lui est propre. 

La Figure 8 illustre le cas de I'indexation d'un document 
30 image 52 contenu dans une base d'images 51 prealablement enregistree, 
pour caracteriser cette image 52 par un nombre fini de parametres 
pouvant etre facilement stockes et manipules ulterieurement. On procede 
a I'etape 53 a ('extraction de termes du document a chercher qui sont 
stockes dans une memoire tampon, (etape 54). 
35 On opere a I'etape 55 une projection dans I'espace des termes de la 

base de references. . 
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A I'etape 56, on procede a une description vectorielle donnant les 
valeurs de pertinence des termes dans le document a chercher. 

L'etape 57 consiste en une repartition des termes dans N groupes 
58 de concepts. 

5 L'etape 59 consists en une projection dans I'espace des concepts de 

chaque groupe 58 pour obtenir N partitions 61. 

Enfin, une projection orthogonale 62 conduit a N ensembles 63 de 
descriptions vectorielles reduites. 

Lors d'une phase ulterieure de recherche, suite a une requite 
10 formulee par un utilisateur, par exemple Pidentification d'une image 
question, on recherche tous les documents multimedias similaires ou 
repondant a cette requete. Pour ce faire, comme indique plus haut, on 
calcule les termes du document question et on les compare aux concepts 
de la base afin de deduire le ou les documents de la base qui sont 
15 similaires au document question. 

On decrira ci-dessous de fagon plus detaillee la phase de 
construction des termes d'une image. 

La phase de construction des termes d'une image met en ceuvre 
utilement la caracterisation des supports structured de I'image. Les 
20 supports structurels sont les elements qui composent la scene de I'image. 
Les plus significatifs sont ceux qui delimitent les objets de la scene car ce 
sont eux qui caracterisent les differentes formes qui sont percues 
lorsqu'on observe une quelconque image. 

Cette etape concerne I'extraction de ces supports structurels. Elle 
25 consiste en un demantelement des zones frontieres des objets de I'image, 
qui sont caracterisees par des endroits entre deux zones ou de fortes 
variations dlntensite sont observees. Ce demantelement s'opere par un 
procede qui consiste a repartir ces zones frontieres parmi differentes 
« classes » selon I'orientation locale du gradient de Hmage (orientation de 
30 la variation locale dlntensite). On obtient ainsi une multitude de petits 
elements denommes les « Elements de Support structurels » (ESS). 
Chaque ESS appartenant effectivement a un contour d'une scene est 
caracterise par une similarite au niveau de I'orientation locale de son 
gradient. Ceci est une premiere etape qui vise a repertorier tous les 
35 elements de Support structurels de I'image. 
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La demarche suivante s'opere desormais a partir de ces ESS, a 
savoir la construction de termes decrivant les proprietes locales et 
globales des ESS. 

Sont considerees comme proprietes locales les informations 
5 extraites de chaque support. Deux types de supports peuvent §tre 
distingues : les elements de droites rectilignes (EDR) et les elements 
d'arcs de courbes (EAC). 

Les elements de droites rectilignes EDR sont caracterises par les 
proprietes locales qui sont : 

10 "La dimension (longueur, largeur) 

° Direction principale (pente) 

a Proprietes statistiques des pixels constituant le support 
(valeur moyenne d'energie, les moments) 

a Informations du voisinage ( Transformee de Fourier 
15 locale) 

Les elements d'arcs de courbes EAC quant a eux sont caracterises 
de la meme facon que prececlemment, en plus de la courbure des arcs. 

Les proprietes globales englobent les statistiques telles que le 
nombre de chaque type de supports et leurs dispositions spatiales 
20 (associations geometriques entre les supports : connexites, gauche, droite, 
milieux...). 

En resume, pour une image donnee, les informations pertinentes 
extraites des objets la constituant sont regroupees sur le tableau 1. 
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Supports structuraux des 


[ Type . 


obje< 


:s d'une image 


ESS 


EDR 


\ EAC 1 


Proprietes 
globales 

- 


Nb total 


n 


m 




1177 T - - « 

iv& /owgy (> seuil) 


nl 


\ njl 


1 


Nb courts (< seuil) 


nc 


J njc 


J IfcC I 


Nb de supports 
longs a une 
connexion gauche 
ou droite 


j — 


Tljlgdx 


n 2 lgdx 


Nb d'une 
connexion milieu 


— 


njlgdx 


n 2 lgdx 


Nb de sunnnrtv 
longs paralleles 




njpll 


n 2 pll 




Luminance 
(> seuil) 








Proprietes 
locales 


Luminance 
(<seuil) 










Pente 










Courbure 










Caracterisation du 
voisinage des 
supports 1 









Tableau 1 



La phase de construction des termes d'une image met en ceuvre 
egalement la caracterisation des informations texturales pertinentes de 
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I'image. Les informations venant de la texture de I'image sont divisees 
selon trois aspects visuels de limage : 

- I'aspect aleatoire (comme une image de sable fin, ou d'herbe) 
ou aucun arrangement particulier ne peut §tre decele, 

■ I'aspect periodique (comme un pull en jacquard) 0C1 une 
repetition de motifs (pixel ou groupement de pixels) dominants 
est observee, 

■ et enfin I'aspect directionnel ou les motifs tendent globalement 
a s'orienter vers une ou des directions privilegiees. 

Ces informations sont obtenues en approchant I'image par des 
modeles ou representations parametriques. Chaque aspect est pris en 
compte par ses representations spatiale et spectrale qui constituent les 
informations pertinentes de cette partie de limage. La periodicite et 
I'orientation sont caracteris£es par les supports spectraux tandis que 
Taspect aleatoire se traduit par I'estimation des parametres d'un modele 
autoregressif bidimensionnel. 

Une fois toutes les informations pertinentes extraites, on peut 
procecJer a la structuration des termes des textures. 
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Supports spectraux ei 
parametres autoregressifs de la 
texture d'une image 


j 

L 


Composante 
periodique 


Nb total 

d'elements 

periodiques 


np J 




Frequences 




Couple (a> p , v p \ 0< P ^„ P 




Amplitudes 


Couple {C P ,D P \ 0<pznp 1 


Composante 
directionnelle 


Nb total 
d' elements 
directionnels 


nd | 




Orientations 


Couple («„ fi,\ 0<i£nd J 




Frequences 


v„ 0<i£nd 1 


Composantes 
aleatoires 


Ecart-type du bruit 


<7 1 




Parametres 
autoregressifs 





Tableau 2 



La phase de construction des termes d'une image peut enfin mettre 
egalement en oeuvre la caracterisation de la couleur de I'image. 
5 La couleur est souvent representee par les histogrammes de 

couleur, ces derniers sont invariants a la rotation et robustes contre 
I'occlusion et les changements de points de vue de la camera. 

La quantification des couleurs peut se faire dans I'espace RVB 
(Rouge, Vert, Bleu), TSV (Teinte Saturation Valeur), ou I'espace LUV mais 
10 la methode d'indexation par les histogrammes de couleurs a prouve ses 



1er depot 



34 



limites car elle donne une information globaie de I'image, et lors de 
Indexation on peut trouver des images ayant le m§me histogramme de 
couleur, mais qui sont completement differentes. 

Beaucoup d'auteurs proposent des histogrammes de couleurs en 
5 integrant Information spatiale. Ceci consiste par exemple a distinguer les 
pixels coherents des pixels incoherents, un pixel est coherent sll 
appartient a une region assez large regroupant des pixels identiques,il est 
classe incoherent sll fait partie d'une region de taille reduite. 

On decrira plus loin un procede de caracterisation de la distribution 
10 spatiale des constituants de I'image (par exemple la couleur) qui est moins 
couteux en temps de calcul que les methodes citees ci dessus, et est 
robuste aux rotations et a la translation. 

Les differentes caracteristiques extraites des elements de support 
structurels ainsi que les parametres des composants periodique, 
15 directionnel et aleatoire du champ de texture ainsi que les parametres de 
la distribution spatiale des constituants de I'image constituent les termes 
pouvant servir a la description du contenu d'un document. Ces termes 
sont regroupes dans des concepts afin de reduire les informations utiles 
d'un document 

20 Les occurrences de ces concepts ainsi que leurs positions et leurs 

frequences constituent ce qu'on appelle Vempreinte d'un document. Ces 
empreintes vont ensuite servir de trait d'union entre un document 
question et les documents d'une base, lors d'une phase de recherche de 
document. 

25 Une image ne contient pas forcement tous les elements et les 

caracteristiques decrits plus haut. Par consequent, identifier une image 
commence par la detection de la presence de ses elements constituants. 

La Figure 9 montre un exemple d'organigramme d'un processus 
d'extraction des termes d'une image avec une premiere etape 71 de 
30 caracterisation des objets de I'image en supports structurels, qui peut le 
cas echeant etre precede d'un test de detection d'elements structurels 
permettant d'omettre cette etape 71 dans les cas ou les elements 
structurels sont absents. 

L'etape 72 consiste en un test pour determiner s'il existe un fond 
35 texture. Si c'est le cas, on passe a une etape 73 de caracterisation du fond 
texture en supports spectraux et parametres autoregressifs AR, puis a une 
etape 74 de caracterisation de la couleur de fond. 
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S'il n'existe pas de fond structure, on passe directement de I'etape 
72 a I'etape 74. 

Enfin, une etape 75 reside dans le stockage des termes et la 
construction d'empreintes. 

5 On reviendra malntenant de facon plus detaillee sur la 

caracterisation des elements de support structured d'une image. 

Le principe de base de cette caracterisation consiste en un 
demantelement des zones frontieres des objets de Hmage en multitudes 
de petits elements de base appeles elements de supports significatifs 
10 (ESS) qui vehiculent les informations utiles des zones frontieres qui sont 
composees de bandes lineaires de taille variable, ou des coudes de 
differentes courbures. Des statistiques faites sur ces objets seront alors 
analysees et utilisees pour construire les termes de ces supports 
structured . 

15 Afin de decrire plus rigoureusement les principaux precedes 

composant cette approche, on notera une image numerisee par 
I'ensemblefrfc j\ ixj}, ou I et J sont respectivement le nombre de 
lignes et de colonnes de llmage. 

A partir des images gradient vertical {g v (Ul(Uh lxj}et 

20 horizontal fe M (fj\(u)e Ixj} prealablement calculees, cette approche 
consiste a parhtionner Hmage selon rorientation locale de son gradient en 
un nombre fini de classes equidistantes. Llmage contenant i'orientation du 
gradient est definie par la formule : 

25 La partition n'est autre qu'une subdivision angulaire du plan 2D (de 

0° a 360°) par un pas de discretisation bien defini. Le fait d'utiliser 
rorientation locale du gradient comme critere de decomposition des zones 
frontieres permet un meilleur groupement des pixels faisant partie d'une 
meme zone frontiere. Afin de resoudre ie probleme des points frontieres 

30 qui peuvent itre partages entre deux classes juxtaposees, une deuxieme 
partition avec le meme nombre de classes que precedemment, mais 
decalees de Vz classe est utilisee. A partir des classes issues des deux 
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partitions, une simple procedure consiste a choisir celles qui totalisent le 
plus grand nombre de pixels. En effet, chaque pixel appartient a deux 
classes chacune issue des deux partitions. Sachant que chaque pixel est 
un element potentiel d'un eventuel ESS, il vote alors pour la classe qui 
5 contient le plus de pixels parmi les deux. II s'agit d'une region ou la 
probability de trouver un ESS de taille plus elevee est la plus forte 
possible. A la suite des votes, on retient uniquement les classes qui 
totalisent plus de 50% des suffrages. Ce sont les regions de support 
susceptibles de contenir les ESS. 

10 A partir de ces regions de support, on determine les ESS, on les 

repertorie selon certains criteres qui peuvent itre : 

B La longueur (on determine pour cela un seuil lo et on 
comptabiiise les ESS inferieurs et superieurs a ce seuil) 

■ L/intensite definie par la moyenne du module du gradient des 
15 pixels composant chaque ESS. ( un seuil nofc§ Io est alors defini, 

on repertorie ceux qui sont inferieurs et superieurs a ce seuil). 

■ Le contraste defini par la difference entre le maximum et le 
minimum des pixels. 

A cette etape du procede, tous les elements dits structurels sont 
20 connus et repertories conformement aux types de supports structurels 
pre-identifies. lis peuvent £tre extraits de I'image d'origine pour iaisser 
place a la caracterisation du champ de textures. 

A titre d'exemple, considerons I'image 81 de la Figure 11, reprise 
comme image 101 de la Figure 14a, les zones frontieres sont illustrees 

25 sur I'image 102 de la Rgure 14b. Les elements de ces zones frontieres 
sont ensuite demanteles et repartis selon I'orientation de leur gradient 
parmi differentes classes representees par les images 103 a 106 des 
Figures 14c a 14f.. Ces differents elements constituent les elements de 
supports significatifs, et leurs analyses statistiques permettent de 

30 construire les termes du composant structure!. 

Dans le cas des Figures 14c a 14f, a titre d'exemple, I'image 103 
correspond a une classe 0 (0° - 45°), I'image 104 correspond a une classe 
1 (45° - 90°), I'image 105 correspond a une classe 2 (90° - 135°) et 
I'image 106 correspond a une classe 3 (135° - 180°). 
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En I'absence d'elements structured, on suppose que Hmage est 
texturee avec des motifs plus ou moins reguliers et on procede a une 
caracterisatton du champ de la texture. Pour cela, on peut proceder a une 
decomposition de I'image en trois composantes qui sont : 
5 - Une composante texturale contenant les informations 

anarchiques ou aleatoires (comme une image de sable fin, ou 
dTierbe) ou aucun arrangement particulier ne peut etre decele, 
- Une composante periodique (comme un pull en jacquard) ou 
une repetition de motifs dominants est observee, 
10 " & enfin "ne composante directionnelle ou les motifs tendent 

globalement vers une ou des directions privilegiees. 

L'objectif etant de caracteriser parfaitement la texture de Hmage a 
partir d'un ensemble de parametres, ces trois composantes sont 
representees par des modeles parametriques. 

15 s~f w nS !' 13 t f <tUre de ,1ma9e 15 ^Suliere et homogene notee 
\y\*>jw>j)elxJ} est decomposee en trois composantes 16, 17, 18 

comme illustre sur la Figure 10, conformement a la relation suivante : ' 



20 



30 



Mu)}= Mu)}+Mu)Me(i,j)} (i6) 



Ou {w(ij)} est la composante purement aleatoire 16, {h(i,j)} est la 
composante harmonique 17 et { e fc/)} la composante directionnelle 18. 
L'estimation des parametres de ces trois composantes 16, 17, 18 termine 
cette etape d'extraction dlnformations d'un document. Des methodes 
25 d'estimation sont decrites dans les paragraphes suivants. 

On decrira d'abord un exemple de procede de detection et 
caracterisation de la composante directionnelle de I'image. 

II s'agit dans un premier temps d'appliquer un modele parametrique 
a la composante directionnelle^y)}. Elle est constituee d'une somme 
denombrable d'elements directionnels ou chacun est associe a un couple 
d'entiers { a ,p) definissant une orientation d'angle 0 tel que^tatr 1 Bhc 
Autrement dit, e{ij) est defini par e fc y)= ^(ij) ou chaque e, a Jj 

est defini par : 
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J)- Xt^ (to - ^)xoos(2jr-5^-5- (fi8 + ja)) 



(17) 



OU 



• We est le nombre d'elements directionnels associes a (a,p), 

• v t est la frequence du A i6me element, 

5 • {a* (/a - 7)3)} et (za - y/3)} sont les amplitudes. 

La composante directionnelle{e(?,y)} est ainsi parfaitement definie 
par la connaissance des parametres contenus dans le vecteur Esulvant : 

* = \zi>Pl&*>sMtMt\ aj ,^ 0 (18) 

Pour estimer ces parametres, on utilise le fait que la composante 
10 directionnelle d'une image est representee dans le domaine spectral par 
un ensemble de droltes de pentes orthogonales a celles definies par les 
couples d'entiers du modele qui seront notes Ces droites 

peuvent etre decomposees en un sous ensemble de droites de meme 

pente associe chacun a un element directionnei. 
15 A titre ^illustration, les Figures 15a et 15b montrent des images 84, 

86 contenant un element directionnei et la Figure 15c montre une image 

88 contenant deux elements directionnels. 

La figure 15al montre une vue 85 en trots dimensions du spectre 

de I'image 84 de la Rgure 15a. 
20 Les Figures 15bl et 15cl montrent des images module de Fourier 

87, 89 respectivement des images 86 et 85 des Figures 15b et 15c. 

Pour calculer les elements du vecteur E f on peut adopter une 
approche fondee sur la projection de I'image sulvant differentes directions. 
Le procede consiste dans un premier temps a s'assurer de la presence de 
25 la composante directionnelle avant d'estimer ses parametres. 

La detection de la composante directionnelle de I'image est basee 
sur la connaissance des proprietes spectrales de celle-ci. Si on assimile le 
spectre de Timage a une image 3D (X,Y, Z), ou (X,Y) represented les 
coordonnees des pixels et Z Tamplitude, les droites qu'on cherche a 
30 detecter sont representees par un ensemble de pics concentres le long de 
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droites dont les pentes sont definies par les couples recherches 
(cf. figure 15al). Pour determiner la presence de ces droites, il sufflt de 
comptabillser les pics predominants. Le nombre de ces pics renseigne sur 
la presence ou non de supports directionnels ou harmoniques. 

On decrira maintenant un exemple de procede de caracterisation de 
la composante directionnelle. Pour cela, on procede ay calcul des couples 
de direction (or,, ft) et a la determination du nombre d'elements 
directionnels. 

On effectue d'abord le calcul de la transformee de Fourier Discrete 
(TFD) de Hmage suivi d'une estimation des droites de pente rationnelle 
observees dans llmage transformee 

Pour cela, on definit un ensemble de projections qui discretise le 
domaine frequentiel en differents angles de projection Q k , k fini. Cet 
ensemble de projection peut etre obtenu de diffeYentes manieres. On peut ' 
par exemple chercher tous couples d'entiers premiers entre eux (cc k ,J3 k ) 

definissant un angle 6 k , tel que e h =tan- 1 |4- 0 c, <*. un ordre rtel 

que 0<a k> p k <r permet de contrdler le nombre de projections. Les 
proprietes de symetrie peuvent ensuite §tre utilisees pour obtenir tous les 
couples jusqu'a 2k . Ces couples sont illustres sur la Figure 16 pour 

0<a k) p k Z3. 

Des projections du module de la TFD de I'image sont effectuees 
suivant les 9 k . Chaque projection engendre un vecteur de dimension 1, 
V (°M> not e V k pour simplifier la notation, qui contient les informations 
directionneiles recherchees. 



Chaque projection V^est donnee par la formule : 
K{n)=^(i+rp k J+ta k \ 0<i+rp k < /-i,o < j+ra k <J-l 
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avec n = -i* p k + j*a k etO <L\n\<N k etN k =\a k \{T -\)+\p k \{L-l)+\ , 
ou T*L est la taille de Hmage. Yfcy) est le module de transformee de 
Fourier de Umage a caracteriser. 

On selectionne pour chaque v k les elements de fortes energies alnsi 
5 que leurs positions spatiales. Ces elements de forte energie sont ceux qui 
presentent une valeur maximale par rapport a un seuil calcule selon la 
taille de Hmage. 

A cette etape de calcul, le nombre de droites est connu. On en 
deduit le nombre de composantes directionnelles Ne en utilisant les 
10 proprietes spectrales simples de la composante directionnelle d'une image 
texturee. Ces proprietes sont : 

1. Les droites observees dans le domaine spectral d'une 
composante directionnelle sont symetriques par rapport a 
I'origine. On peut par consequent reduire le domaine 

15 dlnvestigation sur une moitie seulement du domaine 

considere. 

2. Les maxima retenus dans le vecteur sont candidats a 
representer des droites appartenant a des elements 
directionnels. A partir de la connaissance des positions 

20 respectives des droites sur le module de transformee de 

Fourier discrete TFD, on en deduit le nombre exact 
d'elements directionnels. La position du maximum droite 
correspond a I'argument du maximum du vecteur V k , les 
autres droites du m§me element sont situees tous les 
25 min{L,T}. 

Le mecanisme de projection est illustre sur la Figure 17 pour 
(<x k .Pk) = {2, -1). 

Apres traitement des vecteurs V k et production des couples de 
direction [a k ,p k ) on obtient les nombres de droites associes a chaque 

30 couple. 

Ainsi on peut compter le nombre total d'elements directionnels en 
utilisant les deux proprietes sus-mentionnees et on identifie les couples 
d'entiers i@ k> $ k ) associes a ces composantes qui sont les directions 
orthogonales a celles qui ont ete retenues. 
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Pour tous ces couples (a k ,0 k ) I'estimation des frequences de 
chaque element detecte est Immediate. En effet, si i'on considere 
uniquement les points de I'image d'origine le long de la drolte d'equation 
i&k-jfk^c, c est la position du maximum dans Vk f et ces points 
5 constituent un signal monodimensionnel (1-D) harmonique d'amplitude 
constante et qui a pour frequence II sufflt alors d'estimer la 

frequence de ce signal 1-D par un procede classique (localisation de fa 
valeur maximale sur la TFD 1-D de ce nouveau signal). 

En resume, on peut mettre en ceuvre le procede comportant les 
10 etapes suivantes : 

On determine le maximum de chaque projection. 

Les maximums sont filtres afin de ne garder que ceux superieurs a 
un seuil. 

- Pour chaque maximum m„ correspondant a un couple 

■ on determine le nombre de droites associees a ce couple ' 
d'apres les proprietes decrites plus haut. 

- on calcule la frequence associee a (<x k J k )qui correspond 
a I'intersecOon de la droite maximale (correspondant au 

-° maximum de la projection retenue) avec I'axe horizontal. 

On decrira maintenant le calcul des amplitudes & a,/}) (o} et $ a ' fi \t)} qui 

sont les autres parametres contenus dans le vecteur E mentionne plus 
haut. 

5 Connaissant la direction (d fc ,0 k ) et la frequence V k , on peut 

determiner les amplitudes fj*«(c) et if^c), pour c v^rifiant la formule 
i&t -J0&=c f en utilisant un procede de demodulation. En effet, i&^Vc) 
est egal a la moyenne des pixels le long de la droite d'equation 
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id k -jp k =c de la nouvelle image obtenue en multipiiant y(i,j) par 



cos 



* 2 k + 0* W* + I* Cecl est traduit par I'equation 



^> (c) * £3?(/ 57 -)cOS 



) 



(20) 



ou Afe n'est autre que le nombre d'elements de ce nouveau signal. 
De la meme maniere, on obtient ?i a,/}) (c) en appliquant i'equation : 



S id-J0=c 



(21) 



10 



Le procede decrit ci-dessus peut etre resume par les etapes 
suivantes : 

Pour tout element directionnel (pc k ,0 k ) faire 

Pour toute droite (d) calculer 

1. la moyenne des points (i,j) ponderee par le 

cosi — — —vp t + ia» 1 1. Cette moyenne correspond a 



I'estimation du I'amplitude s ( k a - p \d) 



2. la moyenne des points (i ,j) ponderee par le 



sin 



-f — —Wk +J^k ) • Cette moyenne correspond a 
+Pk J 

I'estimation du I'amplitude i k {a - p \d) 

Le tableau 3 ci-dessous recapitule les etapes principales du procede de 
projection. 
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Etape 1. Calculer I'ensemble de couples de projection (a k> p k )e P r 
Etape 2. Calculer le module de la TFD de llmage y{i f) ■ 



Etape 3-Pour tout (a k ,B k )eP r/ 

calculer le vecteur V k : la projection de yfov) suivant (a B ) 
d'apres la formule ( 19) * 



Etape 4- Detection de droites : 
Pour tout <pc k ,p k )eP r , 

• determiner : M k = max{F t (/)}, 



j 



• calculer n k: , le nombre de pixels de valeurs significatives 
rencontres le long de la projection 

• sauvegarder n k et Jnax Hndice du maximum dans V k . 

• selectionner les directions qui justifient le critere 
M k 

~~ >S e 
* 

ou s e est un seuil a definir, dependant de la taille de llmage, 

Les directions retenues sont considerees comme celles de droites 
recherchees. s 



Etape 5- Sauvegarder les couples (d k J k ) recherches qui sont les 
orthogonaux des couples (a k ,J3 k ) retenus dans I'etape 4. 



Tableau 3 



On decrira ci-dessous la detection et la caracterisation des 
informations texturales periodiques d'une image, qui sont contenues dans 
la composante harmonique{/i(w)}. Cette composante peut etre 
representee par une somme finie de sinusoides 2-D : 

p 

h {i> J) = E C p cos 2jc(ia> p + jy p )+ D p sin 2n{ia> p + Jv p ), (22) 



1er depot 



44 

ou 

• c p et d p sont les amplitudes. 

• (a> p ,v J est la pf ime frequence spatiale. 

On a represente sur la Figure 18al une image 91 contenant des 
5 cpmposantes periodiques et, sur la Figure 18bl, une image synthetique 
contenant une composante periodique. 

La Hgure 18a2 represente une image 92 qui est une image module 
de la TFD presentant un ensemble de pics. 

La Rgure 18b2 represente une vue 3D, 94, de la TFD qui montre la 
10 presence d'une paire de pics symetriques 95, 96. 

Sur le domaine spectral, la composante harmonique apparaft ainsi 

comme des paires de pics isoles symetriques par rapport a I'origine (cf. 

Figure 18 (a2)-(b2)). Cette composante est le reflet de I'existence de 

periodicites dans llmage. 

15 Les informations que I'on cherche a determiner sont les elements 

du vecteur : 

H = Hc p ,D p ,o> p ,v p YJ . (23) 

Pour cela on commence par detecter la presence de cette 
composante periodique dans I'image module de Fourier et on estime 
20 ensuite ses parametres. 

La detection de la composante periodique consiste a determiner la 
presence de pics isoles sur I'image module de la TFD. On opere de la 
mime maniere que dans le cas de la determination de la composante 
directionnelle. D'apres le procede decrit dans le tableau 1, si la valeur n k 
25 obtenue dans la phase 4 du procede decrit dans le tableau 1 est 
inferieure a un seuil, alors on est en presence de pics isoles qui 
caracterisent la presence de composante harmonique plutot que de pics 
formant une droite continue. 

La caracterisation de la composante periodique revient a localiser 
30 les pics isoles sur I'image module de la TFD. 
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Ces frequences spatiales {& P J P ) correspondent a la position de ces 

pics : 

ffi,,V, )= argmaxT(fi),v) ( 2 x\ 

Pour le calcul des amplitudes (c p ,D p ), on utilise un procede de 

5 demodulation comme pour estimer les amplitudes de la composante 
directionnelle. 

Pour chaque element periodique de frequence I'amplitude 
correspondante est identique a la moyenne des pixels de la nouvelle 
image obtenue en multipliant Hmage {yQ,j)} par cosfo&,+/*J. ceci est 
10 traduit par les formules suivantes : 

d ,=j^%%yMM»*,+m* p ). (25) 

b > =i~^%%yM co < n& f + ^ f ) (26) 



En resume, un procede d'estimation de la composante periodique 
15 comprend les etapes suivantes : 



Etape 1. Localiser les pics isoles dans la deuxieme moitie de 
I'image module de Fourier et compter leur nombre 



Etape 2. Pour tout pic detecte : 

0 Calculer sa frequence a I'aide de la formule (24) 

- Calculer son amplitude a I'aide de la formule (25 
26) 



Les dernieres informations a extraire sont contenues dans la 
composante purement aleatoire {w{ij)}. Cette composante peut §tre 
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representee par un modele autoregressif 2-D de support demi-plan non 
symetrique (DPNS) flni defini par I'equation aux differences suivante: 

wfcy)=- ^ci ki Ai-k,j-l)+u{i,j) (27) 

ou K»\v >s , M sont ,e s parametres a determiner pour tout (*>/) 

5 appartenant a 

s HJt =$k,i)/k=o, izi<;Myj{(k,i)/i<k<N,-M s/^Af}. Le couple 

(N,M) s'appelle I'ordre du modele. 

• {"(*>/)} est un bruit blanc gaussien de variance finie aj. 
Les parametres du modele sont donnes par : 
10 W = lNMW u ,{a kJ \ WN J (28) 

Les methodes d'estimation des elements de W sont nombreuses 
comme par exemple I'algorithme de Levinson 2D ou alors les methodes 
adaptatives du type moindres carres (MCR). 

On decrira maintenant un procede de caracterisation de la couleur 
15 d'une image dont on veut extraire des termes tj representant des 
caracterisBques iconiques de cette image, la couleur etant un exemple 
particulier de ces caracteristiques qui peuvent comprendre d'autres 
caracteristiques telles que les moments algebriques ou geometriques, les 
proprietes statistiques, les proprietes spectrales des moments de pseudo- 
20 Zemicke. 

La methode est fondee sur la caracterisation perceptuelle de la 
couleur. En premier lieu on effectue une transformation des composantes 
de la couleur de I'image de I'espace RVB (Rouge, Vert, Bleu) encore 
denomme RGB, vers I'espace TSV (Teinte Saturation Valeur) encore 

25 denomme HSV. On obtient ainsi trois composantes : Teinte, Saturation, 
Valeur. A partir de ces trois composantes on determine N couleurs ou 
composantes iconiques de I'image. Chaque composante iconique Ci est 
representee par un vecteur de M valeurs . Ces valeurs represented la 
distribution angulaire et annulaire des points representant chaque 

30 composante ainsi que le nombre de points de la composante en question. 

La methode developpee est illustree par la Figure 19 avec a titre 
d'exemple N =16 et M= 17 . 
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Dans une premiere etape principal 110, a partir d'une image 11 de 
I'espace RGB, on precede a une transformation de I'image 111 de I'espace 
(R,G,B) a I'espace HSV (etape 112) pour obtenir une image dans I'espace 
HSV. 

Le modele HSV peut etre defini de la fagon suivante. 

Teinte (H) : varie de [0 360] , et chaque angle represente une 

teinte. 

Saturation (S) : varie de [0 1], elle mesure la purete des 
couleurs, et permet de distinguer les couleurs "vives", "pastels", ou 
"delavees ". 

Valeur (V) : Elle prend des valeurs de [0 1], elle indique si une 
couleur est claire ou sombre et dans quelle mesure elle se 
rapproche du blanc ou du noir. 

Le modele HSV est une transformation non lineaire du modele de 
I'espace (R,G,B) .L'ceil humain peut distinguer 128 teintes ,130 
saturations , et 23 ombres . 

Pour le Blanc V=l et S=0 , le noir a une valeur V=0 tandis que la 
teinte Het la saturation Ssont indeterminees. 
Lorsque V=l et S=l on a une couleur pure. 

Chaque couleur est obtenue en rajoutant du blanc ou du noir a la 
couleur pure. 

Pour avoir des couleurs plus claires on reduit Set on garde H et V f 
par contre, pour des couleurs foncees on rajoute du noir en reduisant ^ et 
on garde HetS. 

Le passage de Hrnage couleur exprimee dans les coordonnees 
(R,G,B) en une image exprimee dans I'espace (H,S,V) fTeinte, Saturation, 
Valeur) s'effectue de la fagon suivante : 
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Pour tout point de coordonnee (i,j) et de valeur (Rk,B k ,Gic) on 
produit un point de coordonnees (i,j) et valeur (Hk,Sk,V k ) avec : 



10 



15 



V k =tMO.{R k> B k> G k ) 

_ V k -mm(R k ,G k ,B k ) 



G * B " si F*est6gal&i?* 



V k -mm(R k ,G k ,B k ) 
V k -vam{R k ,G k ,B k ) 



4+ *^ 



I V k -min(R k ,G k> B k ) 



si Fiestegala^ 



On precede ensuite a une partition de I'espace HSV (etape 113). 



A partir des valeurs de Teinte, Saturation, Valeur , on a defini N couleurs. 
20 Dans le cas ou N est egal a 16, on a : Noir, Blanc, Gris clair, Gris fonce, 

Gris moyen, Rouge, Rose, Orange, Marron, Olive, Jaune, Vert, Bleu Ciel , 

Bleu-vert, Bleu , Pourpre, Magenta. 

Pour chaque pixel on evalue a quelle couleur il appartient. Ensuite 

on calcule le nombre de points de chaque couleur. 
25 Dans une deuxieme etape principale 120, on procede a une 

caracterisation des partitions obtenues lors de la premiere etape principale 

110. 

Dans cette etape 120, on cherche a caracteriser chaque partition Ci 
obtenue precedemment. Une partition est definie par sa composante 

30 iconique et par les coordonnees des pixels qui la constituent. La 
description d'une partition est fondee sur la caracterisation de la 
repartition spatiale de ces pixels (nuage de points). La methode 
commence par le calcul du centre de gravite, I 'axe principal du nuage de 
points et I'axe perpendiculaire a cet axe. Le nouveau repere est utilise 

35 comme reference dans la decomposition de la partition Ci en plusieurs 
sous-partitions qui sont representees par le pourcentage des points 
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constituant chacune des sous-partitions. Le processus de caracterisation 
d'une partition Ci est le suivant : 

-calculer le centre de gravite et Tangle d'orientation des 
composantes Ci definissant le repere de partitionnement, 

5 - calculer la distribution angulaire des points de la partition Ci dans 

les N directions dans le sens contraire des aiguilles d'une montre, en N 
sous-partitions definies par : 

mo 160 2x360 ix360 (N-l)x360, 
N ' N ' ""' ~W ' "" N } 

10 - partittonner I'espace de I'image en carres de rayons 

concentriques, avec calcul dans chaque rayon du nombre de points 
correspondant a chaque composante iconique. 

Le vecteur caracteristique est obtenu a partir du nombre de points 
de chaque repartition de couleur Ci, du nombre de points dans les 08 
15 sous-repartitions angulaires ainsi que du nombre de points de I'image. 

Ainsi le vecteur caracteristique est represents par 17 valeurs dans 
I'exemple considere. 

Sur la Figure 19, on a illustre la deuxieme etape 120 de traitement 
a partir des composantes iconiques CO a C15 en montrant pour les 

20 composantes CO (module 121) et C15 (module 131) les differentes etapes 
effectuees, a savoir le partitionnement angulaire 122, 132 conduisant a un 
nombre de points dans les 8 orientations considerees (etape 123, 133) et 
le partitionnement annulaire 124, 134 conduisant a un nombre de points 
dans les 8 rayons consideres (etape 125, 135), ainsi que la prise en 

25 compte du nombre de pixels de composante CO respectivement C15 dans 
I'image (etape 126, respectivement 136). 

Les etapes 123, 125, 126 conduisent a la production de 17 valeurs 
pour la composante CO (etape 127) tandis que les etapes 133, 135, 136 
conduisent a la production de 17 valeurs pour la composante C15 (4taoe 
30 137). v 

Naturellement, le processus est analogue pour les autres 
composantes CI a C14. 
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Les Figures 20 et 21 illustrent le fait que le precede decrit ci-dessus 
est invariant a la rotation. 

Ainsi, dans I'exemple de la Figure 20, I'image est partitionnee en 
deux sous-ensembles, Tun contenant les croix x, I'autre les ronds 0. Apres 
calcul du centre de gravite ainsi que de Tangle d'orientation 8, on obtient 
le repere d'orientation qui permettra d'obtenir les 04 sous-repartitions 
angulaires (0°, 90°, 180°, 270°). 

Par la suite, on effectue une repartition annulaire, on calcule le 
nombre de points dans un rayon egal a 1 puis 2. On obtient le vecteur VO 
caracteristique de I'image de la Figure 20 : 19 ; 6 ; 5 ; 4 ; 4 ; 8 ; 11. 

L'image de la Rgure 21 est obtenue en appliquant une rotation de 
90° a I'image de la Figure 20. En appliquant le precede ci-dessus a I'image 
de la Figure 21, on obtient un vecteur VI caracterisant cette derniere qui 
montre que la rotation n'influence par le vecteur caracteristique- Cela 
permet de conclure que la methode est invariante a la rotation. 

Comme indique plus haut, les methodes permettant d'obtenir pour 
une image les termes representant les couleurs dominantes, les proprietes 
texturales ou les structures des zones dominantes de I'image, peuvent 
etre appliquees aussi bien sur la totalite de I'image que sur des portions 
de I'image. 

On decrira brievement ci-dessous des processus de segmentation 
d'un document qui permettent de produire les portions de I'image a 
caracteriser. 

Selon une premiere technique possible, on precede a une 
decomposition statique. L'image est decomposed en blocs avec 
recouvrement ou sans recouvrement. 

Selon une deuxieme technique possible, on precede a une 
decomposition dynamique. Dans ce cas, la decomposition de l'image en 
portions est fonction du contenu de l'image. 

Selon un premier exemple de technique de decomposition 
dynamique, les portions sont produites a partir des germes qui sont les 
points de singularity de I'image (les points d'inflexions). On commence par 
calculer les germes, qui sont ensuite fusionnes pour qu'il n'en reste qu'un 
nombre reduit et enfin les points de llmages sont fusionnes aux germes 
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ayant les memes proprieties visuelles (statistiques) pour produire les 
portions ou les segments de I'image a caracteriser. 

Selon une autre technique faisant appel a une segmentation 
hierarchique, les points de I'image sont fusionnes pour former les n 
5 premieres classes. Ensuite les points de chacune des classes sont 
decomposes en m classes et ainsi de suite jusqu'a atteindre le nombre de 
classes desire. Lors de la fusion, les points sont affectes a (a classe la plus 
proche. Une classe est representee par le centre de gravite et/ou un 
deiimiteur (boite englobante, segment, courbe, ...). 
10 On decrira maintenant les etapes principales d'un procede de 

caracterisation des formes d'une image. 

La caracterisation de la forme s'effectue en plusieurs etapes : 
Pour une suppression d'effet de zoom ou variation dQ aux 
mouvement des elements non rigides de I'image (mouvement des levres, 
15 des feuilles d'arbre, ...), on procede par une multiresolution suivie d'une 
decimation de I'image. 

Pour une reduction de I'effet de translation, I'image ou la portion de 
I'image est representee par sa Transformee de Fourier. 

Pour une reduction de I'effet de zoom, I'image est definie dans 
20 I'espace logarithmique polaire. 

On peut mettre en ceuvre les etapes suivantes : 
a/ multiresolution f = wavelet(I,n) ; ou I est llmage de depart et n est le 
nombre de decompositions 
b/ projection de I'image dans I'espace logPolaire: 
25 g(l,m) = f(ij) aveci = l*cos(m) etj = l*sinCm) 

c/ calcul de la transformee de Fourier de g : H = FFT(g) ; 
d/ caracterisation de H : 

dl/ projection de H dans plusieurs directions (0, 45, 90 , .„) : le resultat 
est un ensemble de vecteurs dont la dimension est egale a la dimension 
30 du segment de projection 

d2/ calcul des proprietes statistiques de chaque vecteur de projection 
(moyenne, variance, les moments). 

Le terme representant la forme est constitue des valeurs des proprietes 
statistiques de chaque vecteur de projection. 
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REVINDICATIONS 

1. Precede d'indexation de documents multimedias, caracteVise en 
5 ce qu'il comprend les etapes suivantes : 

(a) identification et extraction pour chaque document de termes ti 
constitues par des vecteurs caracterisant des proprietes du document 
multimedia a indexer, telles que la forme, la texture, la couleur ou la 

10 structure d'une image, I'energie, le taux d'oscillation ou des 

informations frequentielles d'un signal audio, ou un groupe de 
caracteres d'un texte , 

(b) stockage des termes % caracterisant des proprieties du document 
multimedia dans une base de termes comprenant P termes, 

15 (c) determination d'un nombre maximum N de concepts souhaites 
regroupant les termes tj les plus pertinents, N etant un nombre 
entier inferieur a P, et chaque concept q etant prevu pour regrouper 
tous les termes voisins du point de vue de leurs caracteristiques, 

(d) calcul de la matrice T de distances entre les termes ti de la base de 
20 termes, 

(e) decomposition de I'ensemble P des termes tj de la base de termes en 
N parties P, (1 <: j<N) telles que P = PI UP 2 " UPj ... UP N , chaque 
partie Pj comprenant un ensemble de termes et etant representee 
par un concept q, les termes tj etant repartis de telle facon que les 

25 termes les plus eloignes se trouvent dans des parties P t , P m distinctes 

et les termes proches se trouvent dans la m§me partie Pi, 

(f) structuration du dictionnaire de concepts de maniere a constituer un 
arbre binaire ou les feuilles contiennent les concepts q du 
dictionnaire et les nceuds de I'arbres contiennent les informations 

30 necessaires a la scrutation de I'arbre lors d'une phase d'identification 

d'un document par comparaison avec les documents precedemment 
indexes, et 

(g) construction d'une base d'empreintes constitute de I'ensemble des 
concepts q representant les termes ti des documents a indexer, 

35 chaque document etant associe a une empreinte qui lui est propre. 
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2. Precede d'indexation selon la revendication 1, caracterise en ce 
que Ton associe a chaque concept q de la base d'empreintes un ensemble 
deformations comprenant le nombre NbT de termes dans les documents 
IndiceDoc ou le concept q est present. 

3. Proceed d'indexation selon la revendication 1 ou la revendication 
2, caracterise en ce que pour chaque document IndiceDoc ou un concept 
q est present, on enregistre une empreinte du concept q dans le 
document IndiceDoc, cette empreinte comprenant la frequence 
d'occurrence du concept q, I'identification des concepts qui sont voisins du 
concept q dans le document IndiceDoc et un score qui est une valeur 
moyenne des mesures de similarites entre le concept q et les termes tf du 
document IndiceDoc qui sont les plus proches du concept q. 

4. Precede d'indexation selon I'une quelconque des revendications 
1 a 3, caracterise en ce qu'il comprend une etape d'optimisation de la 
partition de I'ensemble P des termes de la base de termes pour 
decomposer cet ensemble Pen M classes Q (l < j <, m, avec M <; P), de 
maniere a reduire I'erreur de la repartition de I'ensemble P des termes de 
la base de termes en N parties (P lr P 2/ ... p n ) 0 u chaque partie P, est 
representee par le terme qui sera pris comme concept q, I'erreur 
commise e etant telle que £ = ±e t 0 u £</ 2 (*„/,) est I'erreur 

commise lorsqu'on remplace les termes tj d'une partie P s par tj. 

5. Precede d'indexation selon la revendication 4, caracterise en ce 
qu'il comprend les etapes suivantes : 

(i) on decompose I'ensemble P de termes en deux parties P x et P 2 ; 

(ii) on determine les deux termes les plus eloignes t* et tj de I'ensemble 
P correspondant a la plus grande distance D fj de la matrice T de 
distances ; 

(Hi) pour chaque terme t* de I'ensemble P, on examine si la distance D w 
entre le terme tk et le terme ti est plus petite que la distance entre 
le terme tk et le terme % si e'est le cas on affecte le terme t k a la 
partie Pi et si ce n'est pas le cas on affecte le terme t k a la partie P 2 ; 
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2. Procede d'indexation selon la revendication 1, caracterise en ce 
que Ton associe a chaque concept q de la base d'empreintes un ensemble 
d'informations comprenant le nombre NbT de termes dans les documents 
ou le concept q est present. 

5 

3. Procede d'indexation selon la revendication 1 ou la revendication 
2, caracterise en ce que pour chaque document ou un concept q est 
present, on enregistre une empreinte du concept q dans le document, 
cette empreinte comprenant la frequence d'occurrence du concept q, 

10 I'identification des concepts qui sont voisins du concept q dans le 
document et un score qui est une valeur moyenne des mesures de 
similarites entre le concept q et les termes ti du document qui sont les 
plus proches du concept q. 

15 4. Procede d'indexation selon I'une quelconque des revendications 

1 a 3, caracterise en ce qu'il comprend une etape d'optimisation de la 
partition de I'ensemble P des termes de la base de termes pour 
decomposer cet ensemble Pen M classes Q (1 < i < M, avec M < P), de 
maniere a reduire Perreur de la repartition de I'ensemble P des termes de 

20 la base de termes en N parties (Pi, P 2 ,- Pn) ou chaque partie Pi est 
representee par le terme ti qui sera pris comme concept q, I'erreur 

N 

commise e etant telle que e = ^e t _ ou £,.= £rf 2 est I'erreur 

/=i i 1 tjep, 

commise lorsqu'on remplace les termes tj d'une partie Pi par % 

25 5. Procede d'indexation selon la revendication 4, caracterise en ce 

qu'il comprend les etapes suivantes : 

(i) on decompose I'ensemble P de termes en deux parties Pi et P 2 ; 

(ii) on determine les deux termes les plus eloignes tj et tj de I'ensemble 
P correspondant a la plus grande distance Du de la matrice T de 

30 distances ; 

(iii) pour chaque terme tk de I'ensemble P, on examine si la distance Dw 
entre le terme tket le terme ti est plus petite que la distance D w entre 
le terme t k et le terme tj, si c'est le cas on affecte le terme tk a la 
partie Pi et si ce n'est pas le cas on affecte le terme t k a la partie P 2 ; 
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(iv) on itere I'etape (i) jusqu'a I'obtention du nombre N de points Pj 
souhaite et a chaque iteration on applique les etapes (ii) et (iii) sur 
les termes des parties Pi et P 2 . 

6. Procede d'indexation selon la revendication 4 ou la revendication 
5, caracterise en ce qu'il comprend une optimisation a partir des N parties 
disjointes {Pi, P 2 ,... P N r de i'ensemble P ainsi que des N termes it lf t 2/ tjyj }► 
qui les represented pour reduire I'erreur de decomposition de I'ensemble 
P en N parties, et en ce qu'il comprend les etapes suivantes : 

(i) calcul des centres de gravite Q des parties Pi 

(ii) calcul des erreurs eC, = ^(C,,*,) et et* = %d 2 (.t„t,) lorsqu'on 

'J' ePi tJePi 

remplace les termes tj de la partie Pi respectivement par Q et par tj, 

(iii) comparaison de etj et eq et remplacement de tj par Q si eq < etj, 

(iv) calcul de la nouvelle matrice T de distances entre les termes tj de la 
base de termes et processus de decomposition de I'ensemble P des 
termes de la base de termes en N parties, sauf si une condition 
d'arret est remplie avec £Ct ~ ec '+ 1 < seuil, ou ec t represente I'erreur 

commise a I'instant t. 

7. Procede d'indexation selon I'une quelconque des revendications 
1 a 6, caracterise en ce que pour effectuer une structuration du 
dictionnaire de concepts, on produit de faoon iterative a chaque iteration 
une carte de navigation en commencant par scinder I'ensemble des 
concepts en deux sous-ensembles, puis en selectionnant un sous- 
ensemble a chaque iteration jusqu'a I'obtention du nombre de groupes 
souhaite ou jusqu'a ce qu'un critere d'arret soit satisfait. 

8. Procede d'indexation selon la revendication 7, caracterise en ce 
que le critere d'arret est constitue par le fait que les sous-ensembles 
obtenus sont tous homogenes avec un ecart-type faible. 

9. Procede d'indexation selon la revendication 7 ou la revendication 
8, caracterise en ce que lors de la structuration du dictionnaire de 
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concepts, on determine des indicateurs de navigation a partir d'une 
matrice M = [o, c 2 ,... c N ] e 9t p * N de I'ensemble C des concepts q e 3l p ou 
q represente un concept de p valeurs, selon les etapes suivantes : 
(i) on calcule un representant wde la matrice M 
5 (ii) on calcule la matrice de covariance M entre les elements de la 

matrice M et le representant wde la matrice M, 

(iii) on calcule un axe de projection u des elements de la matrice M, 

(iv) on calcule la valeur pi = d(u,q ; - d(u, w) et on decompose 
I'ensemble de concepts C en deux sous-ensembles CI et C2 de la 

10 maniere suivante : 

{c t e CI si pi £ 0 
c, e C2 si pi > 0 



15 (v) on stocke dans le nceud associe a C les informations <u, w, \pl\, p2> 
ou pi est le maximum de tous les pi < 0 et p2 est le minimum de 
tous les pi > 0, I'ensemble des informations {u, w, |pl| r p2} 
constituant les indicateurs de navigation dans le dictionnaire de 
concept. 

20 

10. Procede d'indexation selon Tune quelconque des revendications 
1 a 9, caracterise en ce que Ton analyse a la fois les composantes 
structurelles et les complements de ces composantes structurelles 
constitue par les composantes texturales d'une image du document, et en 
25 ce que : 

(a) lors de I'analyse des composantes structurelles de I'image 

(al) on procede a une repartition des zones frontieres des structures de 

I'image en differentes classes selon I'orientation de la variation locale 
30 d'intensite de maniere a definir des elements de support structurel 

(ESS) de I'image, et 
(a2) on procede par analyse statistique a la construction de termes 

constitues par des vecteurs decrivant les proprietes locales et 

globales des elements de support structurels, 
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30 



35 



(b) lors de I'analyse des composantes texturales de I'image 

(bl) on procede a une detection et une caracterisation parametrique 

d'une composante purement aleatoire de I'image, 
5 (b2) on procede a une detection et une caracterisation parametrique 

d'une composante peViodique de i'image, 
(b3) on procede a une detection et une caracterisation parametrique 

d'une composante directionnelle de I'image, 

r 

10 (c) on regroupe dans un nombre limite de concepts i'ensemble des 
elements descriptifs de I'image constitues par d'une part fes termes 
decrivant les proprietes locales et giobales des elements de support 
structured et d'autre part les parametres des caracterisations 
parametriques des composantes aleatoire, periodique et 
direcbonnelle definissant les composantes texturales de I'image, et 

(d) on definit pour chaque document une empreinte a partir des 
occurrences, des positions et des frequences desdits concepts. 

11. Procede d'indexation selon la revendication 10, caracterise en 
ce que les proprietes locales des elements de support structured prises en 
compte pour la construction de termes comprennent au moins le type de 
support choisi parmi une bande lineaire ou un arc de courbe les 
d.mensions en longueur et largeur du support, la direction principal du 
support et la forme et les proprietes statistiques des pixels constituant le 
support. 

12. Procede d'indexation selon la revendication 10 ou la 
revendication 11, caracterise en ce que les proprietes giobales des 
elements de support structured prises en. compte pour la construction de 
termes comprennent au moins le nombre de chaque type de supports et 
leur disposition spatiale. 

13. Procede d'indexation selon Tune quelconque des revendications 
10 a 12, caracterise en ce que lors de I'analyse des composantes 
structurelles de I'image on procede a un test prealable de detection de la 



20 
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presence d'au moins une structure dans I'image et, en cas d'absence de 
structure, on passe directement a I'etape de I'analyse des composantes 
texturales de I'image. 

14. Procede d'indexation selon I'une quelconque des revendications 
10 a 13, caracterise en ce que pour proceder a une repartition des zones 
frontieres des structures de I'image en differentes classes, a partir de 
I'image numerisee definie par I'ensemble des pixels y(i,j) ou (i,j) e 1x3, 
avec I et J designant respectivement le nombre de lignes et le nombre de 
colonnes de I'image, on calcule I'image gradient vertical g v (i,j) avec (i,j) e 
I x J et I'image gradient horizontal g h avec (i,j) e I x J et on procede au 
partitionnement de I'image selon I'orientation locale de son gradient en un 
nombre fini de classes equidistantes, I'image contenant I'orientation du 
gradient etant definie par la formule 



on identifie les classes constituant des regions de support susceptibles de 
contenir des elements de support significatifs, et a partir des regions de 
support, on determine les elements de support significatifs et on les 
repertorie selon des criteres predetermines. 

15. Procede d'indexation selon I'une quelconque des revendications 
1 a 9, caracterise en ce que lors de I'indexation d'un document multimedia 
comportant des signaux video, on choisit des termes tj constitues par des 
images-cles representant des groupes d'images homogenes consecutives, 
et on determine des concepts q par regroupement de termes tj. 

16. Procede d'indexation selon la revendication 15, caracterise en 
ce que pour determiner des images-cles constituant des termes tj , on 
elabore d'abord un vecteur score VS comprenant un ensemble d'elements 
VS(i) materialisant la difference ou la similarity entre le contenu d'une 
image d'indice i et celui d'une image d'indice 1-1, et on analyse le vecteur 
score VS afin de determiner les images-cles qui correspondent aux 
maximums des valeurs des elements VS(i) du vecteur score VS. 




gKhJ) 
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17. Precede d'indexation selon la revendication 16, caracterise en 
ce qu'une image d'indice j est considered comme une image-cle si la 
valeur VSQ) de I'element correspondant du vecteur score VS est un 
maximum et que la valeur VSQ) est situee entre deux minimums min G et 

5 min Det que le minimum Mitel que Ml = (IvSq) - min G|, Ivs® - min 
D I) est superieur a un seuil donne. 

18. Procede d'indexation selon I'une quelconque des revendications 
1 a 9, caracterise en ce que lors de Indexation d'un document multimedia 
comportant des composantes audio, on echantillonne et decompose le 

10 document en trames, qui sont ensuite regroupees en clips dont chacun est 
caracterise par un terme t| constitue par un vecteur de parametre. 

19. Procede d'indexation selon la revendication 18, caracterise en 
ce qu'une trame comprend entre environ 512 et 2048 echantillons du 

15 document audio echantillonne. 

20. Procede d'indexation selon la revendication 18 ou la 
revendication 19, caracterise en ce que les parametres pris en compte 
pour la definition des termes ti comprennent des informations temporelles 

20 correspondant a au moins Tun des parametres suivants : r&ieigle des 
trames du signal audio, I'ecart-type des energies des trames dans les clips, 
le rapport des variations sonores, le rapport de basse energie, le taux 
d'oscillation autour d'une valeur pn&eterminee, le haut taux d'oscillation 
autour d'une valeur predetermine^ la difference entre le nombre de taux 

25 d'oscillation au-dessus et au-dessous du taux d'oscillation moyen des 
trames de clips, la variance du taux d'oscillation, le rapport des trames 
silencieuses. 

21. Procede d'indexation selon I'une quelconque des revendications 
30 18 a 20, caracterise en ce que les parametres pris en compte pour la 

definition des termes ti comprennent des informations frequentielles 
correspondant a au moins I'un des parametres suivants : le centre de 
gravite du spectre de frequence de la transformee de Fourier courte du 
signal audio, la largeur de bande du signal audio, le rapport entre I'energie 
dans une bande de frequence et I'energie totale dans toute la bande de 
frequence du signal audio echantillonne, la valeur moyenne de la variation 
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du spectre de deux trames adjacentes dans un clip, la frequence de 
coupure d'un clip. 

22. Procede d'indexation selon I'une quelconque des revendications 
5 18 a 21, caracteris£ en ce que les parametres pris en compte pour la 

definition des termes tj comprennent au moins la modulation d'energie a 
4 Hz. 

23. Procede d'indexation selon I'une quelconque des revendications 
10 1 a 14, caracterise en ce que I'on analyse les formes d'une image d'un 

document selon les etapes suivantes : 

(a) on procede a une multiresolution suivie d'une decimation de J'image, 

(b) on definit I'image dans I'espace logarithmique polaire. 

(c) on represente I'image ou la portion de I'image concernee par sa 
15 transformee de Fourier H, 

(d) on procede a une caracterisation de la transformee de Fourier H de la 
facon suivante : 

(dl) on projette H dans plusieurs directions pour obtenir un ensemble 
de vecteurs dont la dimension est egale a la dimension du 
20 mouvement de projection, 

(d2) on calcule les proprietes statistiques de chaque vecteur de 
projection, et 

(e) on represente la forme de I'image par un terme tj constitue des 
valeurs des proprietes statistiques de chaque vecteur de 
25 projection. 
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